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本 书 根据 FPGA 设计 实践 中 的 经 验 总 结 ， 


计 的 最 佳 实 用 设计 方法 学 。 该 方 法 学 涉及 了 称 个 FPGA 设计 
了 到 设计 了 验证， 几乎 涵 
分 为 14 章 ， 主 要 包括 设计 初 
团队 设计 环境 ， 以 及 设计 


设计 规范 到 RTL 代码 设计 ，: 县 
所 有 技巧 。 全 书 共 
书 、FPGA 器 件 选 择 、 
耗 和 热 分 析 、RTL 代码 设计 、 


IP 及 设计 重 


验证 、 时 序 收敛 ， 设计 完成 语 的 在 线 调试 和 设计 签收 等 内 容 ， 并 


中 常见 的 问题 和 设 [优化 提供 了 县 体 的 指导 。 
本 书 主要 讲述 了 FPGA 设计 过 程 中 的 经 验 、 
解决 复杂 FPCA 设计 中 的 各 类 问题 ， 对 获 和 
A 帮助 。 

本 书 可 以 作为 程 类 、 自 动 控 制 类 、 
生 教学 用 书 ， 也 可 程 人 员 自 学 与 参半 
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译 者 序 


我 是 电子 科技 大 学 的 一 名 青年 教师 ， 面 对 研究 生 利用 FPGA 做 项 目 过 程 中 的 
种 种 困惑 ， 我 意识 到 他 们 迫切 需要 在 掌握 了 利用 硬件 描述 语言 (HDL) 进行 编 
码 的 基本 技巧 后 ， 能 获得 设计 方法 论 方面 的 指导 。 这 样 才 能 提升 设计 效率 ， 提 高 
设计 系统 的 性 能 。 我 常常 在 他 们 提出 问题 或 碰 到 困难 时 ,将 多 年 来 在 FPGA 设计 
领域 积累 的 经 验 和 体会 传授 给 人 他们， 但 终究 感觉 自己 的 知识 不 够 系统 和 全 面 。 

1997 年 ， 我 的 导师 赵 和 平 (航天 501 部 ) 派 我 到 北京 航空 航天 大 学 ， 参 与 
到 与 夏 宇 闻 老 师 的 项 目 合 作 中 ， 并 顺利 地 完成 了 RS (255，223) 编码 /解码 器 设 
计 研 究 的 硕士 课题 。 我 在 夏 老 师 的 具体 指导 下 ， 掌 握 了 利用 Verilog 设计 的 基本 
方法 ， 受 益 菲 浅 。 在 北航 学 习 期 间 ， 我 了 解 到 夏 老 师 经 常 阅读 国外 书籍 和 文献 、 
学 识 渊博 ， 认 真 负责 ， 待人 诚 足 ， 乐 于 提携 年 轻 老 师 。2012 年 初 ， 我 向 夏 老 师 
请 教 业 界 有 没有 关于 FPGA 设计 方法 学 的 书 时 。 他 立即 推荐 了 Springer 出 版 社 在 
2010 年 出 版 的 《FPGA Design: Best Practices for Team-based Design》。 

我 在 大 致 阅读 了 这 本 由 Altera 公司 副 总 裁 Philip Simpson 编写 的 书后 ， 感 觉 
它 几 乎 涵盖 了 利用 FPGA 进行 系统 设计 的 整个 流程 ， 在 关键 的 地 方 又 有 所 侧重 。 
这 本 书 源 于 FPGA 设计 过 程 中 的 实践 经 验 ， 介 绍 的 方法 学 涉及 FPGA 的 项 目 管 
理 、 设 计 规划 、 资 源 利 用 、 设 计 环 境 、 电 路 板 设计 、 功 耗 与 热 分 析 、RTL 代码 设 
计 、IP 和 设计 重用 、 软 硬件 接口 、 功 能 验证 、 时 序 收 化 、 在 线 系 统 调试 和 设计 
交付 等 多 方面 的 内 容 。 最 重要 的 是 这 本 书 全 面 地 介绍 了 团队 合作 完成 FPGA 设计 
的 具体 方法 ， 对 如 何 组 织 团队 合作 进行 FPGA 设计 ， 提出 了 建设 性 的 意见 和 建 
议 。 这 在 当今 复杂 系统 的 FPGA 设计 中 非常 实用 。 书 中 论述 的 一 些 方 法 ， 是 我 不 
知晓 的 ， 是 我 曾 在 实践 中 碰 得 头 破 血 流 才 体会 到 的 。 越 读 这 本 书 ， 越 觉得 有 相 见 
恨 晚 的 感觉 。 书 中 所 介绍 的 方法 可 以 供 广大 FPGA 设计 者 、 项 目 管理 者 学 习 和 借 
鉴 ， 对 缩短 FPGA 项 目的 设计 周期 ， 提 高 设计 性 能 有 很 大 的 帮助 。 因 此 ， 我 下 决 
心 将 这 本 书 翻译 出 来 ， 把 基于 团队 设计 的 最 佳 FPGA 设计 方法 学 介绍 给 大 家 。 

夏 老 师 在 翻译 之 初 曾 给 我 提 了 一 些 专业 的 建议 和 指导 。 当 时 ， 我 认为 已 经 把 
握 了 一 些 翻译 的 精 岩 。 然 而 ， 随 着 翻译 的 进展 ， 遇 到 的 困难 远 远 超过 了 我 的 预 
期 。 我 感觉 高 质量 的 翻译 工作 确实 是 博大 精深 的 。 对 于 本 书 而 言 ， 如 何 真 实地 反 
映 作者 的 思想 ， 一 方面 需要 有 深厚 的 专业 知识 ， 还 要 能 够 使 用 简明 扼要 、 通 俗 易 
懂 、 通 顺 的 文字 进行 表达 。 往 往 一 个 句子 、 甚 至 一 个 词语 的 翻译 都 需要 苦 酌 很 
久 。 有 了 时， 我 觉得 翻译 得 “已 经 很 好 ”的 一 段 译文 过 几 天 再 看 ， 都 还 有 很 大 
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的 改进 空间 。 即 便 如 此 ， 每 次 当 我 把 自己 认可 的 一 段 译文 发 给 夏 老 师 审阅 ， 夏 老 
师 总 会 提出 很 多 的 修改 意见 。 而 经 夏 老 师 亲 手 修改 后 的 译文 是 如 此 巧妙 与 贴切 ， 
使 我 感到 与 夏 老 师 在 专业 知识 、 文 字 功 底 和 翻译 水 平等 方面 的 巨大 差距 。 

在 整个 翻译 过 程 中 ， 夏 老师 所 体现 出 的 认真 负责 的 态度 让 我 无 比 兽 阁 和 和 钦 
佩 ， 深 深 地 影响 着 我 。 他 让 我 深刻 地 体会 到 “翻译 无 小 事 ”。 虽 然 耗 用 的 时 间 成 
倍增 加 ， 但 是 回 过 头 看 最 后 译文 的 质量 有 大 幅度 的 提高 ， 十 分 值得 ! 

在 这 本 书 即将 出 版 之 际 ， 首 先 要 感谢 夏 老 师 在 整个 翻译 过 程 中 给 我 的 具体 指 
导 和 鼓励 ， 感 谢 夏 老师 对 每 段 译 文 细致 负责 的 修改 和 审核 ; 还 要 感谢 Altera 公司 
上 海 分 公司 范 名 超 高 级 工程 师 对 13 章 译文 的 极 大 帮助 ; 感谢 北京 惠 尔 科技 赵 宗 
明 工 程 师 对 第 1 章 到 第 5 章 译文 所 提 的 修改 建议 ; 感谢 陈 卓 立 、 徒 海 起 、 朱 娟 、 
贺 江 等 同学 所 付出 的 努力 。 

一 份 投 入 ,一 份 收获 。 源 于 实际 ， 用 于 实际 。 愿 所 有 认真 阅读 这 本 书 的 人 ， 
收获 丰厚 ! 


何 春 
2013 年 7 月 


审 校 者 序 


我 是 北京 航空 航天 大 学 电子 信息 工程 学 院 的 一 名 退休 教师 。 在 我 近 50 年 的 
工作 生涯 中 ， 主 要 工作 内 容 是 数字 系统 的 设计 。20 年 前 , 我 已 认识 到 FPGA 在 
数字 系统 设计 方面 的 巨大 潜力 ， 也 深刻 理解 掌握 Verilog 硬件 描述 语言 是 完成 复 
杂 数 字 系 统 设 计 的 关键 。 因 此 ， 多 年 来 我 一 直 坚 持 不 断 地 在 教学 中 推广 基于 Ver- 
ilog 语言 的 FPGA 设计 方法 学 。 

2011 年 底 机 械 出 版 社 的 林 春 泉 编 审 向 我 咨询 有 关 数 字 系 统 设计 的 新 书 。 我 
立即 推荐 了 我 刚 读 过 的 由 施 普 林 格 出 版 集团 2010 年 出 版 的 《FPGA Design: Best 
Practices for Team-based Design》。 

该 书 由 Philip Simpson 编写 。 他 是 Altera 公司 的 资深 技术 专家 , 该 书 源 于 他 
多 年 来 为 许多 FPGA 设计 客户 服务 所 取得 的 宝贵 经 验 。 书 的 内 容 十 分 广泛 ， 几 乎 
涵盖 了 FPGA 设计 工程 的 所 有 方面 ， 书 中 特别 强调 团队 合作 完成 设计 的 具体 方 
法 ， 给 我 留 下 了 极其 深刻 的 印象 。 书 中 论述 的 方法 ,与 我 40 多 年 来 在 工程 实践 
中 积累 的 经 验 不 谋 而 合 ， 而 且 总 结 得 十 分 具体 全 面 。 我 认为 书 中 所 介绍 的 方法 对 
中 国 广 大 的 FPGA 设计 者 有 很 大 的 参考 价值 。 

不 久 ， 电 子 科技 大 学 的 何 老 师 也 向 我 咨询 FPGA 设计 方法 学 的 新 书 。 于 是 我 
也 向 她 推荐 了 该 书 ， 并 希望 她 能 花 点 时 间 把 它 翻译 成 通俗 易 懂 的 中 文 。 她 刚 开 始 
有 些 犹豫 ， 在 我 答应 为 她 的 译 稿 做 修改 和 审阅 后 她 就 同意 了 ， 随 后 我 就 把 她 介绍 
给 林 编 审 ， 并 签订 了 翻译 合同 。 

在 整整 一 年 的 翻译 过 程 中 ， 何 老师 经 常 通过 电子 邮件 与 我 交流 。 虽 然 我 用 了 
不 少时 间 修 改 审 核 译 文 ， 但 是 由 于 水 平 有 限 ， 不 免 存在 遗漏 和 错误 ， 歼 请 细心 的 
读者 不 言 指教。 

在 本 书 出 版 之 际 ， 让 我 感谢 曾经 为 本 书 出 版 做 出 过 贡献 的 所 有 同仁 。 


夏 宇 闻 

北京 航空 航天 大 学 电子 工程 学 院 退 休 教 授 
北京 至 芯 科 技 公 司 FPGA 设计 培训 顾问 
2013 年 9 月 


原 书 序 


2006 年 8 月 一 位 工程 副 总 裁 ，Altera 公司 的 客户 之 一 ， 找 到 Altera 公司 的 工 
程 副 总 裁 米 夏 ， 布 里 奇 (Misha Buricn ) ， 向 他 咨询 怎样 才能 可 靠 地 预测 FPCA 
系统 设计 的 成 本 、 进 度 和 质量 。 

那 时 ， 我 正 负责 为 Altera 设计 软件 制定 设计 流程 的 需求 ， 并 正 为 该 需求 做 深 
入 的 调研 。 

当 我 和 那 位 工程 副 总 栽 一 起 讨论 ， 了 解 他 们 的 FPGA 设计 流程 中 哪些 能 可 靠 
地 运行 、 哪 些 不 能 可 靠 地 运行 时 ， 我 意识 到 该 问题 不 只 是 个 别 客 户 所 特有 的 。 许 
多 利用 FPGA 进行 设计 的 公司 都 存在 这 个 问题 。 这 些 公司 有 一 个 共同 的 特点 ， 那 
就 是 它们 的 许多 设计 团队 分 布 在 不 同 的 地 点 ， 每 个 团队 擅长 完成 的 FPGA 项 目 各 
不 相同 。 若 将 这 些 设计 小 组 的 设计 经 验 整 合 在 一 起 ， 其 范围 十 分 宽广 。 然 而 ， 设 
计 工 具 中 却 没有 相应 的 流程 可 以 让 这 些 设计 团队 能 互相 分 享 设计 模块 。 

在 分 析 了 几 百 位 来 访客 户 提供 的 数据 后 ， 我 发 现在 工程 团队 之 间 ， 设 计 重用 
的 实施 十 分 困难 。 同 时 我 也 注意 到 ， 即 使 在 同一 公司 的 不 同 设计 团队 之 间 ， 甚 至 
同一 个 设计 团队 中 ,各 人 所 使 用 的 设计 方法 学 都 有 可 能 不 同 。 

最 近 ，Altera 公司 已 经 在 自己 的 FPGA 设计 软件 和 卫 研发 流程 中 解决 了 这 个 
问题 。 

基于 Altera 公司 在 帮助 许多 客户 完成 FPGA 设计 时 所 取得 的 成 功 经 验 和 技 
术 ， 我 与 Altera 公司 工程 部 的 顶尖 天 才 们 一 起 研发 了 这 个 最 佳 的 实用 设计 方法 
学 。 我 把 该 方法 介绍 给 了 一 些 客户 ， 他 们 实施 后 ， 都 取得 了 巨大 的 成 功 。 

通过 分 析 过 去 客户 的 数据 和 近 三 年 来 客户 的 反馈 ， 可 以 越 来 越 清楚 地 看 到 设 
计 中 国 队 合作 的 困难 在 这 个 行业 中 广泛 地 存在 着 ， 它 不 仅 只 限于 某 个 FPCA 设计 
公司 ， 而 是 遍及 整个 行业 。 

因此 ， 在 过 去 三 年 中 ， 我 一 直 在 修改 和 调整 FPGA 设计 的 最 佳 实用 设计 方法 
学 ， 试 着 在 几 个 客户 中 实施 ， 都 取得 了 巨大 的 成 功 。 本 书 全 面 涵盖 了 FPCA 设计 
的 最 佳 实用 方法 学 。 现 在 ， 让 我 把 本 书 奉 献 给 所 有 利用 FPCA 器 件 实现 系统 设计 
的 团队 。 


菲利普 ， 辛普森 


美国 加 州 圣何塞 
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1.1 引言 


本 书 介绍 了 FPCA 设计 的 成 功 要 诀 。 这 些 要 诀 源 于 作者 在 帮助 几 百 位 客户 解 
决 各 自 FPGA 设计 小 组 所 遇 到 设计 难题 时 的 经 验 总 结 。 在 深入 了 解 了 他 们 各 自 的 
FPGA 设计 环境 和 步 又 ， 哪 些 管用 、 哪 些 不 管用 的 情况 之 后 ， 作 者 有 能 力 帮 助 他 
们 找到 在 进行 系统 设计 的 过 程 中 几 个 特别 需要 注意 的 地 方 。 更 重要 的 是 ， 这 些 经 
验 促使 作者 编写 一 套 值得 推荐 的 设计 方法 学 ， 为 设计 者 解决 FPCA 设计 中 的 难点 
提供 最 佳 的 具体 指导 。 

本 书 把 阐述 的 重点 放 在 跨 地 域 的 设计 小 组 上 。 其 目的 是 制订 一 套 必须 共同 遵 
守 的 方法 学 来 协调 各 设计 小 组 的 工作 ， 使 设计 小 组 间 模 块 的 交流 /交易 成 为 可 能 ， 
从 而 显著 地 提高 FPGA 设计 小 组 的 工作 效率 。 

本 章 为 在 FPGA 上 实现 系统 设计 的 预期 目标 设立 了 路 标 。 

为 了 获得 预期 的 设计 效果 ， 必 须 遵循 以 下 三 个 步 又 ( 见 图 1-1) : 

1. 合理 的 项 目 规划 和 全 面 的 审核 ; 

2. 选择 恰当 的 FPGA 器件 以 确保 该 器 件 能 为 项 目的 今天 或 未 来 提供 所 需 的 
技术 ; 


成 功 设计 FPGA 的 关键 因素 
“ 项目 要 求 和 目标 


。 产 品 化 时 间 
。 硅 唱 圆 代 工 厂 合作 伙伴 
。 技术 发 展 路 线 


。FPGA 器 件 选择 
。IP 重 用 


。 团 队 设 计 环 境 。 元件 发 展 路 线 
。 可 预测 的 时 序 收敛 FPGA 设 计 选择 供应 商 。 软 件 发 展 路 线 


。 优 化 的 验证 环境 方法 学 们 伙伴 关系 。]IP 发 展 路 线 
“尽早 采用 高 级 工具 


到 1-1 FPCA 开发 三 步 又 
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3. 为 了 缩短 设计 周期 ， 确 保 设 计 如 期 完成 ， 遵 循 并 使 设计 模块 可 在 以 后 的 
项 目 中 重复 使 用 ， 在 FPGA 设计 开发 过 程 中 ， 请 严格 按照 本 章 介 绍 的 方法 。 

上 述 三 个 要 素 必 须 协同 作用 才能 保证 FPGA 设计 的 成 功 。 

应 该 选择 与 公司 有 长 期 合作 关系 的 厂商 开展 设计 协作 。 通 过 共享 技术 路 线 图 
和 共同 管理 现 有 的 项 目 ， 不 仅 可 以 确保 当前 项 目的 成 功 ， 也 可 为 今后 的 项 目 提供 
正确 的 解决 方案 。 协 作 过 程 中 磨合 积累 的 经 验 可 确保 项 目的 成 功 。 

本 书 就 上 述 两 个 议题 做 了 简要 的 阐述 。 

第 三 个 议题 是 FPGA 设计 方法 学 。 本 议题 是 FPGA 最 佳 实用 设计 方法 学 的 主 
焦点 。 它 涵盖 了 整个 FPGA 设计 流程 和 从 基本 到 高 级 的 所 有 技巧 。 这 一 套 设计 方 
法 学 独立 于 FPGA 供应 商 ， 因 此 这 些 议题 和 建议 适用 于 任何 FPGA 器 件 ， 确 实 是 
最 佳 实用 设计 方法 。 虽 然 本 书 中 大 部 分 材料 是 通用 的 ， 但 也 涉及 Altera 设计 工具 
的 某 些 特色 ， 从 而 使 推荐 的 最 佳 设计 方法 更 具 实 用 性 。 

图 1-2 所 示 的 方 框 结构 示 意图 描绘 了 最 佳 实 用 设计 方法 的 轮廓 。 

推荐 的 设计 方法 学 


设计 说 明 书 


到 1-2 建议 采用 的 FPGA 设计 项 目 管理 方法 


图 中 的 每 个 方 框 代表 本 书 中 的 一 个 章节。 功 耗 另 成 一 童 ， 因 为 它 贯 穿 设 计 方 
法 学 中 的 许多 领域 。 关 于 电路 板 布 局 、RTL 设计 、IP 重用 、 功 能 验证 和 时 序 收 
敛 等 议题 ， 由 于 各 团队 使 用 的 设计 方法 学 各 不 相同 ， 因 此 为 了 达成 可 靠 一 致 的 设 
计 结 果 ， 并 缩短 工期 ， 工 程 师 们 需要 得 到 具体 的 指导 。 

FPCA 设计 所 面临 的 许多 挑战 并 不 只 是 在 FPGA 设计 中 独 有 的 ， 它 们 也 是 系 
统 设计 面临 的 共同 挑战 。 但 与 ASIC 设计 相 比 ，FPGA 设计 本 身 确实 存在 特有 的 
挑战 和 机 遇 。 随 着 FPGA 器 件 性 能 的 提高 ， 使 得 面向 FPGA 器 件 进行 更 为 复杂 的 
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设计 成 为 可 能 ， 也 促使 许多 ASIC 设计 师 进行 FPGA 设计 。 这 导致 了 许多 设计 团 
队 将 ASIC 设计 原则 照搬 到 FPGA 设计 上 。 一 般 情况 下 ， 这 对 FPGA 设计 流程 是 
有 益 的 ; 然而 它 需 要 与 FPCA 器 件 带 给 设计 流程 的 好 处 相辅相成 。FPGCA 器 件 的 
可 编程 特性 为 进行 更 多 的 在 线 系统 验证 提供 了 便利 。 奉 FPGA 器 件 的 特性 能 被 正 
确 使 用 ， 则 可 大 大 加 速 验证 周期 ， 然 而 当 其 被 滥用 时 ， 则 会 延长 设计 周期 。1O 
(输入 输出 ) 引 脚 的 可 配置 性 带 来 了 ASIC 设计 中 不 存在 的 挑战 。FPGA 设计 工具 
与 ASIC 设计 工具 无 论 就 功能 和 价格 而 言 ， 均 有 很 大 的 差异 ， 但 它们 都 是 由 EDA 
工业 界 提 供 的 。 
本 书 致力 于 采用 最 佳 设计 方法 以 满足 设计 需求 。 

建议 读者 从 头 到 尾 认真 地 阅读 本 书 ， 当 然 也 可 以 针对 设计 流程 中 的 几 个 块 ， 
有 重点 地 阅读 本 书 的 个 别 章节 ， 以 应 对 设计 团队 面临 的 最 大 挑战 。 
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2.1 项 目 管 理 的 作用 


项 目 管理 的 目标 是 期 望 (设计 方 ) 能 在 经 费 预 算 之 内 ， 按 合同 规定 的 期 限 
和 功能 完成 项 目的 交付 。 所 以 项 目 管理 涉及 以 下 三 个 方面 : 

1. 功能 ; 

2. 开发 时 间 ; 

3. 资源 。 

项 目 经 理 需要 合理 地 平衡 上 述 三 个 方面 ， 以 达到 项 目 目标 。 

目前 ， 有 许多 论述 项 目 管理 的 书籍 和 培训 班 ， 因 此 本 章 只 对 项 目 管理 的 要 素 
做 一 个 简要 的 综述 。 建 议 读者 参加 正式 的 项 目 管理 培训 。 


2.1.1 项 目 管 理 阶 段 


每 个 项 目 都 可 划分 为 三 个 项 目 管理 阶段 : 

1. 规划 阶段 : 列 出 功能 清单 、 制 定 项 目 计 划 以 及 建立 资源 库 、 编 制 预算 ; 

2. 跟踪 阶段 : 掌握 每 月 的 工程 进展 ， 进 行 周 计划 和 更新， 审核 预算 、 掌 握 员 
工 状况 ， 以 及 审核 所 有 工程 变更 指令 单 ; 

3. 收尾 阶段 : 项 目 回顾 、 数 据 挖掘 、 总 结 提高 ， 以 及 下 一 步 的 行动 计划 。 


2.1.2 项 目 持续 时 间 的 估算 


估算 整个 项 目 交 付 时 间 (日 期 最 好 能 按照 以 下 步骤 执行 : 

1. 在 最 近 成 功 完成 的 主要 项 目 中 选择 一 个 项 目 ; 

2. 创建 一 个 宏 模 型 。 为 项 目 规范 制定 、 设 计 和 验证 确定 主要 项 目 阶 段 ， 并 
得 到 各 阶段 确切 的 持续 时 间 以 及 交 车 时 间 ; 

3. 设置 整个 过 程 的 改进 目标 。 例 如 完成 一 个 同等 难度 的 项 目 ， 希望 进度 加 
快 10% ; 

4. 定义 项 目的 复杂 度 ， 如 设计 规格 参数 和 资源 利用 率 。 设 计 规 格 参数 包括 设 
计 说 明 书 页 数 、FPGA 资源 的 大 小 、RTL 代码 的 行 数 以 及 设计 性 能 的 技术 复杂 度 ; 

5. 根据 项 目的 复杂 度 得 到 降 额 因子 (derating factor) ; 

6. 依据 降 额 因子 按 比例 调整 即将 开展 的 项 目 所 需 时 间 ; 


7. 正确 评估 项 目 并 做 出 相应 的 调整 。 
2.1.3 计划 


项 目 计 划 应 经 常 更 新 ， 建 议 至 少 一 周 更 新 一 次 。 

任何 项 目 计 划 更 新 会 议 都 应 简短 ， 并 应 将 重点 放 在 项 目 状 态 信 息 的 收集 上 。 
状态 信息 包括 某 任务 是 否 已 经 开始 执行 、 是 否 已 经 完成 、 还 需 多 久 才 能 完成 ， 以 
及 确定 其 完成 进度 的 所 有 信息 。 

项 目 计 划 更 新 会 议 也 应 被 用 来 估算 某 项 任务 的 工期 。 项 目 经 理 必须 尊重 根据 
实际 资源 运作 情况 而 估算 出 的 工期 但 也 应 对 任何 太 离 谱 的 错误 估计 提出 质疑 。 
2.1.3.1 周 计 划分 析 

项 目 经 理 需 要 每 周 严 格 分 析 项 目 进度 。 分 析 过 程 包 括 以 下 10 个 主要 任务 : 
分 析 和 审议 关键 路 径 ; 
重新 考虑 下 周 计划 的 任务 ; 

. 与 评审 组 的 其 他 人 员 讨 论 任务 的 优先 级 并 最 终 达 成 一 致 ; 
. 为 加 速 关键 路 径 的 执行 制定 一 个 计划 ; 

. 找 出 排 在 关键 路 径 之 后 有 风险 的 其 他 路 径 ; 

. 检查 分 配给 关键 路 径 资 源 上 的 负 和 荷 ; 

. 与 管理 者 确认 资源 的 可 用 人 性; 

.确定 项 目 计划 中 需要 更 多 工作 量 的 部 分 ; 

. 找 准 活动 项 ; 

10. 对 任务 进行 微调 。 

项 目 经 理 一 定 不 要 被 项 目 已 完成 的 百分比 数 所 蒙 珊 ， 这 一 点 至 关 重 要 。 如 图 
2-1 所 示 ， 这 是 一 个 非 线性 函数 ， 所 完成 的 百分比 数 对 于 估计 剩余 任务 持续 期 没 
有 用 处 (图 2-1)。 
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2.1.3.2 积极 主动 的 项 目 管理 

按时 完成 项 目 交付 需要 特别 积极 主动 的 态度 ， 一 定 要 投入 足够 的 管理 力度 到 
项 目 中 去 。 

由 于 项 目 设计 环境 的 不 断 变化 ， 每 周 对 项 目 进度 表 做 严谨 的 更 新 ， 管 理 体制 
上 的 这 种 经 常 不 断 地 关注 不 可 缺少 。 

项 目的 复杂 性 决定 了 需要 用 合适 的 工具 来 减轻 决策 过 程 的 困难 。 关 键 路 径 的 
确定 和 管理 可 简化 优先 级 的 设置 。 
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3.1 设计 说 明 书 : 沟通 是 成 功 的 关键 


在 项 目 正式 启动 之 前 ， 编 写 一 份 完整 而 详细 的 设计 说 明 书 可 以 避免 项 目 开 始 
时 引入 的 错误 ， 从 而 可 以 显著 地 减少 在 项 目 后 期 修改 工程 指令 单 事件 的 概率 。 项 
目 后 期 对 设计 说 明 书 再 做 修改 将 会 严重 影响 项 目的 进度 ， 增 加 开发 成 本 ， 从 而 显 
著 提 高 项 目 成 本 。 设 计 说 明 书 的 任何 重大 修改 都 可 能 导致 需要 更 大 规模 的 FPGA 
器 件 才 能 满足 设计 需求 。 

局 写 设计 说 明 书 的 目的 是 为 了 更 精确 、 清 晰 地 传达 设计 信息 。 

换 一 种 说 法 ， 设 计 说 明 书 是 不 同 设计 小 组 和 人 员 之 间 传 递 信息 的 一 种 重要 手 
段 。 没 有 一 个 项 目 各 参与 方 都 认同 的 、 考 虑 周密 的 设计 说 明 书 ， 很 容易 延误 项 目 
工期 。 这 是 因为 在 项 目 后 期 (的 系统 整合 期 间 ， 参 与 方 ) 各 自 设想 的 需求 不 得 
不 做 一 些 调 整 ; 而 所 有 这 些 都 会 耽误 工期 和 提高 工程 造价 。 上 述 问题 的 关键 点 是 
“各 方 都 认同 ”。 这 就 意味 着 在 项 目的 起 始 阶 段 ， 必 须 安排 一 个 设计 说 明 书 审核 
步骤 。 

被 各 方 完全 认同 的 设计 说 明 书 确保 了 参加 项 目的 各 小 组 之 间 工 作 的 协调 和 一 
致 性 。 这 也 确保 了 交付 的 产品 符合 设计 说 明 书 上 规定 的 功能 ， 从 而 满足 客户 需 
求 。 设 计 说 明 书 也 有 助 于 对 项 目的 开发 成 本 、 资 源 和 项 目 进度 进行 精确 的 估算 。 
高 质量 的 设计 说 明 书 使 我 们 可 以 全 程 跟 踪 项 目的 进展 ， 最 终 制 造 出 高 质量 的 产 
品 。 设 计 说 明 书 也 可 作为 编写 产品 使 用 或 维护 说 明 书 的 参考 ， 这 些 说 明 书 将 与 产 
品 一 起 递交 给 用 户 。 在 所 有 的 说 明 书 中 ， 都 应 对 说 明 书 更 改 的 部 分 做 出 明确 的 标 
记 。 此 外 ， 应 该 用 版 本 控制 软件 来 保存 设计 说 明 书 。 

FPGA 设计 从 定义 到 开发 过 程 的 各 个 不 同 阶段 都 必须 编写 设计 说 明 书 。 
3.1.1 高 级 功能 说 明 书 

高 级 功能 说 明 书 由 系统 工程 小 组 创建 并 负责 维护 。 该 文件 介绍 了 FPCA 设计 
的 基本 功能 ， 其 中 包括 FPGA 和 软件 接口 之 间 必 要 的 交互 ， 以 及 印 制 板 上 FPCA 
与 其 他 设备 之 间 的 接口 。 高 层次 功能 说 明 书 应 由 负责 FPGA 设计 小 组 的 经 理 和 负 
责 软件 设计 的 经 理 共 同 评审 。 在 评审 之 后 ， 文 档 应 做 更 新 ， 以 反映 所 做 的 变更 ， 
并 回答 评审 过 程 中 所 提出 的 问题 。 这 一 评审 过 程 一 直 反 复 进 行 ， 直 到 所 有 问题 都 
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得 到 解决 ， 并 且 整 个 FPGA 设计 小 组 都 理解 并 一 致 赞同 这 些 必要 的 调整 。 

编写 高 层次 功能 说 明 书 的 难点 之 一 是 用 可 理解 的 文字 清晰 地 描述 各 项 功能 。 
坦白 地 讲 ， 大 多 数 工 程 师 虽 精通 数学 和 科学 ， 但 绝 不 可 能 成 为 另 一 个 文学 大 师 约 
翰 . 斯坦 贝 克 。 

可 执行 的 说 明 书 帮助 工程 师 们 解决 了 这 一 难题 。 可 执行 的 说 明 书 描述 的 是 最 
终 系统 功能 的 抽象 模型 ， 实 质 上 它 是 该 系统 的 虚拟 原型 机 。 大 部 分 可 执行 说 明 书 
都 是 用 类 似 “C”(C、C ++ 等 ) 的 系统 描述 语言 编写 的 。 这 些 语言 十 分 适合 》 
想 要 实现 的 系统 创建 功能 模型 ， 但 它 不 能 描述 系统 中 诸如 时 序 、 功 耗 和 设计 规模 
等 关键 特性 。 必 须 再 编写 一 份 高 层次 的 说 明 书 作为 可 执行 说 明 书 的 附件 ， 才 能 
示 系 统 的 这 些 关键 特性 。 这 个 阶段 的 虚拟 原型 机 是 系统 模型 和 测试 平台 ,测试 平 
台 也 是 可 执行 说 明 书 的 一 部 分 。 可 执行 说 明 书 适用 于 整个 开发 过 程 ， 用 来 检查 具 
体 的 执行 过 程 是 否 能 满足 可 执行 说 明 书 的 要 求 。 
并 非 所 有 的 公司 都 把 编写 可 执行 说 明 书 作为 FPGA 设计 过 程 的 一 部 分 ,但 随 
着 越 来 越 多 的 复杂 系统 在 FPGA 器 件 上 的 实现 ， 可 执行 说 明 书 的 使 用 也 日 益 普 
及 。 
3.1.2 功能 设计 说 明 书 

FPGA 设计 小 组 应 该 先 编写 一 份 详细 的 功能 设计 说 明 书 ， 它 体现 的 是 高 层次 
的 功能 需求 指标 。 这 份 说 明 书 应 由 FPCGA 工程 设计 小 组 负责 编写 ， 并 应 经 由 FP- 
GA 设计 小 组 和 他 们 的 管理 者 ， 以 及 来 自 系统 工程 和 软件 设计 小 组 的 代表 们 评审 
并 通过 。 最 终 定稿 的 说 明 书 应 该 包括 FPCA 设计 的 功能 、FPGA 与 系统 其 他 部 分 
(包括 软件 ) 之 间 的 接口 细节 。 

使 用 这 些 接口 的 开发 小 组 必须 一 致 认可 与 FPGA 接口 的 每 个 细节 ， 这 是 一 项 
至 关 重 要 的 工作 。 

例如 在 一 个 设计 中 ，A-D 转换 器 将 采集 到 的 数据 输入 到 FPGA 中 ，FPGA 接 
着 将 数据 传送 到 微 处 理 嚣 中。 该 设计 拥有 软件 和 硬件 接口 ， 因 此 ， 这 个 FPGA 设 
计 说 明 书 必 须 包括 与 A-D 转换 器 之 间 的 硬件 接口 。 这 个 硬件 接口 必须 设计 得 非 
常 可 靠 ， 即 便 是 在 极限 情况 下 ， 也 不 至 于 失效 。 若 设计 时 没有 考虑 到 极限 情况 ， 
很 可 能 这 个 接口 隐患 直到 系统 测试 时 才能 暴露 出 来 。 同 时 ，FPGA 设计 说 明 书 还 
需 包含 和 软件 之 间 的 接口 。 虽 然 板 级 测试 可 以 显示 FPCA 将 无 用 的 数据 送 到 软件 
接口 ， 但 软件 工程 师 若 不 知道 如 何 解 释 或 解决 这 个 问题 ， 这 将 耽误 板 级 测试 的 进 
度 。 在 最 坏 的 情况 下 ， 可 能 导致 软件 或 FPGA 的 重新 设计 ， 最 终 将 耽误 项 目的 进 
度 。 
3.1.2.1 功能 说 明 书 大 纲 

本 市 将 分 8 个 部 分 详细 地 介绍 功能 说 明 书 的 最 低 要 求 。 
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1. 修订 历史 记录 : 这 部 分 内 容 的 样本 如 图 3-1 所 示 。 它 包含 修订 日 期 、 作 者 
和 修改 者 ， 以 及 已 认可 的 修改 要 点 。 
修订 历史 


09 | pompson | 200044/126 | 


2009 年 4 月 26 日 | 初始 版 本 
在 数字 编 解码 器 中 加 入 详细 时 序 信息 


2009 年 5 月 28 工程 师 审议 后 


添加 描述 主机 处 理 器 接口 的 部 分 内 容 
1.3 psimpson | 2009 年 6 月 9 日 | 6 月 4 日 和 软件 工程 师 第 二 次 审议 后 
更 新 主机 处 理 器 接口 
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图 3-1 版 本 控制 页 样本 


2. 评审 会 议 记 录 : 这 部 分 内 容 应 包括 所 有 审核 /讨论 设计 说 明 书 会 议 的 详 
情 。 会 议 记录 应 包含 会 议 日 期 、 地 点 、 出 席 者 和 备忘录 ， 以 及 为 落实 设计 说 明 书 
而 需要 执行 的 各 项 活动 。 

3. 目录 。 

4. 功能 概述 : 这 部 分 内 容 应 描述 所 属 系统 的 背景 。 若 某 项 功能 属于 最 终 FP- 
GA 设计 系统 的 子 系统 ， 则 应 描述 它 在 整个 系统 中 的 位 置 以 及 目的 ， 即 它 所 能 解 
决 的 问题 。 功 能 概述 也 应 包含 必要 功能 的 高 层次 概述 。 

5. 参考 源 : 这 部 分 内 容 应 描述 功能 需求 的 原由 ， 例 如 高 层次 的 功能 说 明 书 、 
软件 接口 功能 的 需求 等 。 

6. 术语 表 : 这 部 分 内 容 应 包含 在 文档 中 用 到 的 所 有 行业 标准 术语 和 缩写 语 。 
更 重要 的 是 ， 也 应 该 包含 在 文档 中 使 用 到 的 公司 内 部 术语 。 公 司 内 部 术语 也 会 引 
起 困惑 并 造成 大 量 时 间 的 浪费 ， 这 是 令 人 吃惊 的 。 许 多 新 员工 和 来 自 其 他 小 组 的 
员工 在 评审 会 中 经 常 不 好 意思 承认 不 理解 缩写 码 字 的 意思 ， 从 而 引起 困惑 、 耽 误 
决策 并 经 常 扼杀 创造 性 。 

7. 详细 的 功能 描述 : 这 部 分 内 容 是 文档 中 真正 有 用 并 值得 细 嚼 的 部 分 。 这 
部 分 内 容 应 包含 对 所 有 使 用 的 算法 、 设 计 架 构 的 细节 、 以 及 与 设计 或 系统 的 其 他 
部 分 之 间接 口 的 详细 描述 。 

8. 测试 计划 : 这 部 分 内 容 应 当 涉 及 测试 计划 ， 或 至 少 指出 编写 测试 计划 的 
必要 性 ， 当 测试 计划 编写 完成 后 ， 应 及 时 更 新 该 文档 。 

9. 参考 资料 : 这 部 分 内 容 应 列 出 为 理解 该 说 明 书 而 需要 阅读 的 所 有 参考 文 
献 。 

在 FPGA 设计 说 明 书 各 部 分 细节 编写 的 同时 ， 工 程 小 组 应 该 编写 许多 工程 部 
门 内 部 评审 规范 ， 其 中 包括 功能 测试 计划 和 质量 (QA) 测试 计划 。 每 个 分 配 到 
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该 项 目的 工程 师 都 应 该 各 司 其 责 ， 制 定 自己 的 工程 计划 和 功能 测试 计划 。 这 些 个 
人 计划 ， 应 先 接受 审核 ， 然 后 在 整个 功能 计划 中 再 次 复审 。 这 样 操作 可 以 确保 满 
足 FPCA 设计 的 总 体 需求 。 
3.1.2.2 测试 说 明 书 大 纲 

1. 修订 历史 记录 : 这 部 分 内 容 的 样本 如 图 3-1 所 示 。 它 包括 修订 日 期 、 作 者 
以 及 认可 的 更 改 。 

2. 评审 会 议 记 录 : 这 部 分 内 容 应 包括 设计 说 明 书 每 个 评审 会 的 详情 。 会 议 
记录 应 包括 会 议 日 期 、 地 点 、 出 席 者 ， 备 忘 录 和 为 设计 说 明 书 获得 批准 所 需 的 必 
要 活动 。 

ee 

4. 测试 范围 : 这 部 分 内 容 应 提供 测试 计划 所 覆盖 的 那些 特定 功能 列表 。 若 
测试 覆盖 范围 和 任何 子 系统 的 测试 范围 出 现 重 羡 ， 则 应 详细 说 明 哪些 功能 是 本 次 
测试 计划 中 覆盖 的 ， 哪 些 是 参照 其 他 测试 计划 的 。 

5. 测试 需求 : 这 部 分 内 容 应 详细 列 出 完成 测试 所 需要 的 特殊 硬件 、 软 件 和 
EDA 工具 。 其 中 还 应 列 出 完成 测试 所 需 的 一 切 特 定 的 准备 工作 。 

6. 测试 策略 : 这 部 分 内 容 应 包含 测试 成 功 或 失败 的 评判 标准 。 本 次 测试 是 
否 需要 和 其 他 子 系统 进行 交叉 验证 ? 为 了 满足 本 次 测试 计划 的 要 求 ， 现 有 的 测试 
是 否 可 以 直接 重用 ， 还 是 需要 改进 后 才能 使 用 ? 测试 是 否 可 以 自动 完成 ? 若 测试 
可 以 自动 完成 ， 则 应 该 说 明 测 试 是 如 何 自动 完成 的 ?如 何 运行 测试 ? 例如， 每 天 
晚上 能 自动 开始 运行 的 寄存 器 自动 测试 ， 与 在 开发 板 上 人 工 运行 ， 验 证 屏幕 上 所 
显示 图 形 是 否 正确 的 人 工 测试 ， 是 两 个 不 同 的 测试 策略 。 

7. 测试 自动 化 计划 : 这 部 分 内 容 描述 的 是 如 何 使 测试 自动 化 ， 应 尽 可 能 地 
实现 测试 自动 化 。 

8. 测试 的 运行 : 这 部 分 内 容 应 描述 预期 的 测试 需要 多 长 时 间 才 能 做 完 ? 若 
测试 不 能 自动 地 进行 ， 则 人 工 完成 这 些 测试 需要 多 长 的 时 间 ? 

9. 测试 文档 : 这 部 分 内 容 应 包含 测试 案例 的 描述 。 按 照 实际 操作 标准 ， 测 
试 设计 者 应 使 每 个 测试 的 激励 互相 独立 ， 用 这 样 的 原则 来 构造 测试 平台 的 基础 结 
构 。 因 此 ， 每 个 测试 案例 都 应 该 有 自己 的 测试 目录 。 测 试 文档 应 详细 介绍 如 何 从 
回归 测试 数据 库 中 存 取 测试 结果 。 当 然 这 是 在 假设 回归 测试 系统 已 经 建立 的 情况 
下 。 没 有 建立 这 样 一 个 回归 测试 系统 的 项 目 注定 会 失败 ， 因 为 没有 它 ， 检 测 产品 
的 质量 将 会 非常 困难 。 

对 于 那些 子 测试 不 能 自动 运行 的 测试 案例 而 言 ， 其 测试 文档 也 应 该 包含 相关 
的 测试 步 又 。 在 这 种 情况 下 ， 有 必要 在 文档 中 说 明 人 工 子 功能 测试 是 如 何 进 行 
的 。 

随 着 FPCA 设计 工作 的 开展 ， 应 把 定期 举办 设计 和 验证 评审 会 作为 工程 实施 
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过 程 中 程序 化 工作 的 一 部 分 ， 以 确保 设计 工作 能 完全 按 计划 开展 。 为 了 解决 项 目 
执行 过 程 出 现 的 实际 问题 ， 并 消除 设计 说 明 书 中 不 太 明 确 的 描述 ， 设 计 修 改 是 不 
可 避免 的 。 评 审 会 为 设计 的 修改 提供 了 沟通 的 平台 。 评 审 会 后 ， 设 计 说 明 书 需要 
更 新 和 复审 。 若 这 些 修改 与 高 层次 的 功能 说 明 书 或 与 FPGA 的 某 个 接口 发 生 冲 
突 ， 还 应 召集 相关 人 员 对 修改 进行 正式 评审 ， 以 落实 这 些 修改 。 

总 之 ， 编 写 说 明 书 的 主要 目的 就 在 于 设计 小 组 之 间 的 信息 交流 ， 以 确保 设计 
符合 客户 方 的 需求 ， 雇 佣 足 够 的 工作 人 员 ， 在 规定 的 期 限 内 按 要 求 完成 项 目的 交 
付 。 

功能 说 明 书 和 测试 说 明 书 应 按 公司 内 部 的 标准 执行 。 公 司 内 部 标准 应 与 国际 
标准 接轨 ， 并 建立 在 与 国际 标准 (如 ISO9001) 兼容 的 基础 上 。 本 书 不 讨论 
ISO9001 标准 的 任何 细节 ， 其 具体 描述 见 http://www. iso. org。 
建议 进一步 阅读 : 由 Ian Alexander 编写 的 需求 。 


4.1 引言 


本 章 分 为 三 个 主要 部 分 。 

第 一 部 分 讲述 工程 资源 ， 无 论 使 用 内 部 资源 还 是 使 用 外 部 合作 者 的 资源 都 将 
涉及 这 部 分 内 容 。 

第 二 部 分 涉及 在 设计 中 究竟 选择 使 用 公司 内 部 可 重用 的 卫 ， 还 是 购买 第 三 
方正 的 问题 。 

第 三 部 分 也 是 最 后 一 部 分 ， 讲 解 如 何 选择 FPGA 器 件 。 这 部 分 内 容 详 细 介 绍 
了 如 何 选择 合适 的 FPGA 器 件 ， 以 使 所 用 器 件 拥有 设计 所 需 的 各 种 资源 。 这 项 工 
作 涉 及 多 方面 的 技术 ， 这 些 技术 可 以 帮助 读者 选择 合适 的 FPGA 噩 件 以 保证 项 目 
的 进度 。 


4.2 工程 资源 


项 目 工程 资源 的 分 配属 于 项 目 管理 任务 。 每 人 工作 任务 的 安排 是 否 恰当 ， 人 
力 资源 配备 是 否 足 够 至 关 重 要 。 从 事 FPGA 设计 工作 ， 需 要 考虑 的 不 仅 是 从 事 
FPGA 设计 的 工程 师 ， 还 必须 包括 为 完成 设计 任务 不 可 或 缺 的 其 他 工程 师 。 因 
此 ， 从 硬件 工程 师 的 视角 而 言 ， 应 该 关注 由 这 些 工程 师 共同 组 成 的 整个 团队 。 这 
个 团队 中 既 有 RTL 设计 师 ， 也 包括 熟悉 FPCA 设计 软件 ， 并 有 设计 集成 经 验 的 
工程 师 ， 以 及 具有 设计 验证 经 验 的 工程 师 。 
有 些 公 司 ， 上 述 这 些 角 色 均 由 同一 个 人 ， 或 由 同一 组 工程 师承 担 。 然 而 ， 依 
据 设计 项 目的 大 小 或 复杂 性 ， 较 大 的 设计 项 目 通常 需要 由 来 自 不 同 工 程 学 科 ， 有 具 
有 不 同 技术 背景 的 工程 师 所 组 成 的 团队 才能 承担 。 从 硬件 工程 师 的 视角 观察 ， 还 
需要 关注 电路 板 设计 工作 ， 因 此 必须 确保 团队 中 有 电路 板 布 局 设计 师 。 他 们 必须 
与 FPGA 设计 师 在 工作 上 保持 密切 的 联系 , 还 需要 确保 团队 人 员 之 间 有 良好 的 合 
作 关 系 。 如 果 电 路 板 上 有 高 速 信和 号， 特别 当 设 计 中 包含 高 速 收发 右 或 高 速 存储 髓 
接口 时 ， 团 队 中 还 需要 有 信和 号 完整 性 工作 经 验 的 工程 师 参与 。 

如 果 设 计 中 用 到 处 理 器 软 核 ， 如 Altera 公司 FPGA 中 的 Nios 工 处 理 器 ， 设 计 
团队 中 还 必须 有 软件 工程 师 参与 。 即 使 只 是 设计 FPGA 与 微 处 理 融 的 接口 ， 在 板 


第 4 章 资源 调查 “13 . 


级 调试 开始 时 ， 也 希望 有 软件 工程 师 参与 。 团 队 中 还 可 能 需要 拥有 其 他 专业 背景 
的 工程 师 。 例 如 ， 某 个 设计 中 包含 DSP 算法 ， 而 算法 设计 师 本 人 却 不 具备 硬件 
设计 背景 ,他 自己 没有 能 力 在 FPGA 上 实现 这 个 设计 。 所 以 项 目 主 管 必须 确保 这 
位 算法 专家 在 整个 设计 过 程 中 和 设计 实现 之 后 的 调试 过 程 中 在 场 ， 以 便 随时 回答 
人 硬件 工程 师 的 提问 。 在 做 其 它 高 级 IP (诸如 PCle 或 CigE 这 样 的 主要 接口 协议 
IP) 核 的 设计 时 ， 也 需要 有 非 硬 件 专业 的 有 关 技 术 专 家 在 场 提供 咨询 。 

确定 哪 部 分 工作 可 利用 公司 内 部 的 工程 资源 实现 ， 哪 部 分 工作 必须 依靠 外 部 
专家 解决 ， 是 工程 资源 分 配 中 的 一 个 重要 决策 。 


4.3 第 三 方 IP 


设计 主管 必须 关注 总 共有 哪些 第 三 方 耻 可用， 其 中 哪 几 个 IP 将 被 用 于 本 设 
计 。 同 样 ， 他 也 必须 关注 公司 内 部 有 哪些 IP 可 以 被 重复 使 用 ， 是否 有 来 自 其 它 
项 目的 IP 可 用 于 本 次 使 用 的 FPGA 系列 。 假 如 正在 使 用 第 三 方 下， 也 许 还 应 该 
关注 购买 这 个 IP 所 附带 的 服务 ， 能 否 获 得 相应 的 咨询 服务 ?对 这 个 IP 在 芯片 面 
耻 、 速 度 和 功能 方面 完全 满足 设计 需求 的 信心 能 达到 什么 程度 ? 


4.4 FPGA 器 件 的 选择 


影响 FPGA 器 件 选 择 的 七 个 主要 因素 排列 如 下 : 

1. 某 款 器 件 所 具有 的 特色 。 为 了 满足 设计 中 的 某 些 特殊 需求 ， 设 计 师 不 得 
不 选用 某 一 款 FPGA 器 件 ， 因 为 其 他 各 款 FPGA 器 件 均 不 能 满足 这 些 特殊 需求 。 

2. 器 件 规模 (密度 ) 。 设 计 总 共 需 要 多 少 个 逻辑 单元 ?” 如 何 用 逻辑 单元 和 存 
储 块 构造 应 用 所 需 的 专用 乘法 器 模块 ?构造 的 优 劣 将 对 所 需 FPCA 器 件 的 价格 产 
生 很 大 的 影响 。 

3. 速度 需求 。 这 将 对 选择 FPGA 器 件 的 系列 和 必须 选用 的 速度 等 级 产生 影 
响 。 同 样 ， 这 也 会 对 FPGA 器 件 的 价格 产生 很 大 的 影响 。 

4. 器 件 引 脚 。 需 要 什么 类 型 的 封装 ? 封装 类 型 和 设计 中 输入 /输出 (170) 
引 脚 的 数量 将 影响 FPGA 器 件 的 成 本 和 电路 板 设计 。 封 装 类 型 也 将 影响 设计 中 输 
人 /输出 的 信号 完整 性 和 性 能 。 

5. 功 耗 。 人 允许 设计 消耗 功率 的 上 限 是 多 少 ? 选用 哪 种 FPGA 器 件 可 以 把 功 
耗 控制 在 预算 的 范围 内 ? 

6. IP 的 可 获得 性 。 需 要 的 IP 是 否 容易 到 手 。 

7. FPGA 器 件 的 可 获得 性 。 确 保 需 要 时 可 以 随手 得 到 想 要 的 FPGA 器 件 。 

以 上 七 个 方面 需要 我 们 更 为 详细 的 关注 。 
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4.4.1 FPGA 器 件 的 特殊 功能 


首先 应 该 关注 的 方面 是 FPGA 器 件 的 专用 资源 。 设 计 需 要 高 速 串 行 接口 吗 ? 
如 果 需 要 的 话 ， 需 要 多 少 个 通道 ， 各 通道 的 性 能 又 如 何 ? 许多 FPCA 器 件 都 自 带 
收发 器 。 收 发 器 性 能 可 分 为 三 个 档次 ， 其 最 高 速度 分 别 达到 3. 125Gbit/s， 
6. 5Gbit/s 和 10Gbit/s + 。 这 些 影响 到 设计 性 能 和 了 PCA 成 本 ， 因 此 它们 是 器 件 选 
择 过 程 中 的 重要 因素 。 还 需要 关注 设计 的 带宽 要 求 。 收 发 器 的 速度 和 数量 决定 了 
带宽 。 例 如 ， 在 通信 市 场 中 ， 如 果 要 实现 100 千 兆 以 太 网 ， 可 能 至 少 需要 10 个 
10Gbit/s 的 收发 需 通 道 。 

同样 ， 如 果 正 在 实现 的 算法 是 运算 量 密集 的 算法 ， 诸 如 DSP 加 密 算法 或 雷 
达 应 用 方面 的 算法 ， 这 就 要 求 FPGA 器 件 具 有 大 量 的 DSP 模块 ， 并 拥有 足够 多 的 
RAM 模块 可 与 这 些 DSP 模块 接口 。DSP 模块 的 配置 也 十 分 重要 。 存 储 模块 的 深 
度 和 数量 会 影响 有 多 少 处 理 可 以 在 芯片 上 执行 ， 如 果 内 部 存储 器 不 够 多 的 话 ， 就 
不 得 不 使 用 外 部 存储 器 。 内 部 存储 器 在 DSP 运算 中 用 于 缓存 算法 处 理 各 阶段 间 
的 处 理 结果 ， 是 非常 重要 的 。 还 需要 关注 专用 DSP 模块 的 数量 和 配置 ， 关 注 需 
要 执行 的 乘法 运算 的 位 宽 是 多 少 。 如 果 DSP 模块 没有 足够 多 的 位 宽 ， 就 不 得 不 
用 逻辑 来 组 合 DSP 块 以 实现 所 需 功能 。 这 会 影响 正在 执行 操作 的 性 能 。 

需要 有 多 少 个 内 部 RAM 模块 呢 ? 当 考虑 使 用 处 理 器 软 核 做 设计 时 ， 这 个 问 
题 变 得 越 来 越 重 要 。 使 用 内 存 块 作为 缓存 可 以 显著 提高 处 理 器 软 核 的 性 能 。 可 用 
RAM 模块 的 大 小 也 十 分 重要 。 若 设计 中 要 用 到 大 量 的 FIFO， 则 需要 特别 注意 可 
用 RAM 模块 的 个 数 ， 而 对 每 个 RAM 模块 中 可 用 位 数 的 需求 可 以 放松 点 。 使 用 
存储 模块 来 实现 FIFO， 很 可 能 造成 内 存 位 的 浪费 ， 这 是 众所周知 的 缺点 。 

设计 调试 过 程 中 的 资源 消耗 也 需要 考虑 。 在 设计 调试 期 间 ， 内 部 存储 器 块 常 
被 用 于 保存 来 自 租 入 式 逻 辑 分 析 仪 的 数据 。 


4.4.2 ”FPGA 的 规模 选 型 (密度) 


在 进行 FPGA 带 件 规模 选 型 时 ， 通 常设 计 尚 未 完成 ， 也 不 完善 ， 因 此 很 难 确 
定 所 需要 FPGA 器 件 的 规模 ， 这 时 往往 需要 根据 以 前 的 经 验 来 选择 FPCA 器 件 的 
规模 。 许 多 设计 是 基于 以 往 的 设计 ， 这 对 FPGA 器 件 的 规模 选 型 会 有 帮助 。 通 常 
的 做 法 是 针对 本 次 设计 想 要 用 的 FPGA 带 件 系列 ， 重 新 编译 旧版 本 的 完整 设计 ， 
或 者 编译 本 次 设计 中 所 用 到 的 那 部 分 旧 代 码 ， 以 便 获得 一 个 大 致 正确 的 规模 估 
计 。 如 果 设 计 中 将 使 用 PP， 就 应 编译 该 PP， 并 将 结果 添加 到 在 总 面积 估算 中 ， 
如 果 正 准备 选用 第 三 方 供 应 商 IP， 就 应 从 供应 商 那 里 得 到 其 面积 估计 。 总 之 ， 
如 果 存 在 老 版 本 设计 的 话 就 应 以 它 为 基础 ， 并 把 将 使 用 的 卫 占用 的 面积 估算 在 
内 ， 然 后 根据 经 验 ， 考 虑 为 实现 新 功能 还 需要 增加 多 少 额外 的 面积 。 一 旦 完成 了 
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这 项 工作 ， 在 已 有 的 面积 预 估 上 再 增加 25% 。 在 FPGA 器 件 规模 选 型 时 ， 应 该 
选择 一 个 比 预 想 需求 大 一 些 的 FPGA 器 件 ， 这 就 是 面积 预 估 方 程 中 增加 25% 的 
出 处 。 

设计 师 应 该 选择 一 个 比 预期 需求 规模 更 大 一 些 的 FPGA 器 件 。 由 于 设计 规模 
有 不 断 扩大 的 趋势 ， 这 样 做 可 以 确保 选 定 的 器 件 可 容纳 下 设计 的 发 展 规模 ， 并 且 
能 使 时 序 收敛 。 设 计 师 就 不 需要 在 器 件 利 用 率 已 达到 95% 时 ， 还 在 为 时 序 收敛 
而 绞 尽 脑汁 ， 或 为 了 使 设计 恰好 能 被 选 定 器 件 容纳 下 ， 而 不 得 不 砍 掉 系 统 的 菜 些 
功能 。 

使 用 较 大 器 件 的 另 一 个 好 处 是 有 助 于 在 FPCA 系统 芯片 内 部 加 快 对 设计 的 检 
查 。 如 果 FPGA 器 件 有 余 量 的 话 ， 布 局 和 布线 软件 可 能 不 必 费 大 力 就 可 以 满足 时 
序 需 求 ， 从 而 缩短 编译 时 间 。 这 对 硬件 工程 师 和 软件 工程 师 都 十 分 有 利 。 越 早 拥 
有 可 实际 使 用 的 器 件 ， 软 件 工程 师 就 可 以 越 早 在 目标 硬件 上 试 着 运行 自己 编写 的 
代码 ， 从 而 加 速 代 码 的 开发 进程 。 这 样 做 ， 使 设计 师 能 够 在 设计 周期 的 起 始 阶段 
就 着 手 硬件 和 软件 的 调试 工作 。 

若 FPGA 留 有 余 量 ， 则 由 设计 后 期 修改 或 产品 版 本 更 新 所 增加 的 逻辑 单元 就 
能 比较 容易 地 被 其 容纳 。 这 是 FPGA 器 件 留 有 余 量 的 又 一 好 处 。 

设计 在 FPGA 器 件 上 正常 运行 后 ， 如 果 FPGA 器 件 上 还 有 大 量 未 使 用 的 资 
源 ， 可 以 换 一 个 较 小 的 FPGA 器 件 以 降低 成 本 ， 而 不 必 担 心 影响 项 目的 进度 。 一 
些 FPGA 供应 商 提供 的 设计 工具 拥有 在 同系 列 的 不 同 规模 (密度 ) 器 件 之 间 自 
动 完成 设计 移植 的 功能 ， 同 时 能 保持 引 脚 不 变 。 但 这 些 功能 对 所 使 用 的 引 脚 (1/ 
0) 资源 是 有 限制 的 ， 只 能 使 用 同系 列 特定 规模 (密度) 范畴 内 器 件 上 都 存在 的 
引 脚 (IO) 资源 ; 这 样 做 的 好 处 在 于 能 改变 设计 ， 使 之 适用 于 较 大 规模 或 者 较 
小 规模 的 FPGA 器 件 ， 可 避免 电路 板 的 重新 设计 。 如 果 这 一 功能 在 所 选择 的 FP- 
GA 供应 商 提供 的 工具 软件 清单 上 没有 ， 可 以 通过 参考 器 件 手册 和 操作 说 明 书 自 
己 编 写 引 脚 移植 程序 。 虽 然 人 工 编写 移植 程序 的 过 程 非常 痛苦 而 且 穿 易 出 错误 ， 
但 在 没有 自动 化 流程 的 情形 下 ， 这 个 投入 是 十 分 值得 的 。( 译 者 注 : 用 纯 手工 方 
式 逐 个 定义 引 脚 是 不 现实 的 。) 

关键 点 在 于 必须 保证 设计 师 选 用 的 FPGA 器 件 系列 ， 具 有 人 允许 在 不 同 规模 的 
FPGA 器 件 之 间 进 行 设计 移植 并 保持 引 脚 不 变 的 能 
建议 选择 一 个 FPCA 器 件 ， 它 在 规模 (密度) 上 既 能 向 上 兼容 以 适应 未 来 
设计 的 增长 ， 又 能 向 下 兼容 以 便 尽 可 能 地 降低 成 本 。 

如 果 打 算 推 出 价位 不 同 、 功 能 不 同 的 多 档次 产品 ， 上 述 功能 非常 有 用 。 只 需 
要 设计 一 种 电路 板 ， 逻 辑 设计 也 只 需 做 一 次 ， 就 能 实现 产品 的 系列 化 。 若 市 场 需 
要 较 低 价位 的 产品 ， 从 FPGA 中 去 除 一些 功 能 即 可 。 通 常 不 同 档次 产品 里 的 电路 
板 和 安装 的 FPCA 完全 相同 ， 所 不 同 的 只 是 FPCA 的 编程 文件 ， 低 档次 产品 的 
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FPGA 编程 文件 中 的 功能 被 减少 了 一 些 而 已 。 只 要 保持 引 肢 兼容， 就 可 以 去 除 一 
些 功能 ， 以 便 用 规模 小 一 些 的 FPGA 器 件 实现 设计 ， 从 而 进一步 降低 材料 的 成 
本 。 


4. 4. 3 速度 需求 


可 以 根据 以 往 的 设计 经 验 来 确定 设计 的 速度 需求 。 对 早 就 拥有 的 设计 或 对 设 
计 进 行 编译 可 得 到 设计 在 目标 器 件 上 实现 后 的 速度 性 能 指标 。 用 这 个 好 办 法 可 以 
估计 出 其 他 设计 块 在 目标 器 件 上 实现 后 的 性 能 指标 。 

FPCA 供应 商 提供 的 产品 说 明 书 也 是 关于 设计 实现 后 性 能 指标 的 优质 信息 
源 。 这 些 产 品 说 明 书 告诉 设计 师 在 时 钟 和 输入 /输出 (1A0) 性 能 方面 期 望 能 
达到 的 绝对 最 大 值 。 虽 然 这 些 指标 是 可 以 达到 的 ， 但 真正 要 达到 这 些 指标 可 能 会 
增加 布局 布线 的 难度 ， 延 长 时 序 收敛 周期 ， 因 此 应 将 速度 指标 降低 约 15% ， 给 
时 序 收敛 留 出 安全 余 量 。 

速度 等 级 的 选择 将 直接 影响 FPGA 器 件 的 价格 。 选 用 FPCA 时 ， 建 议 从 一 开 
台 就 选用 速度 等 级 最 高 的 器 件 ， 尽 快 拿 到 装 有 该 FPCA 器 件 的 电路 板 ， 从 而 及 早 
进行 软件 调试 和 人 硬件 功能 检查 。 若 用 速度 等 级 最 高 的 FPCA 器 件 实现 设计 ， 则 比 
较 容易 满足 设计 的 时 序 需 求 ， 布 局 布线 工具 不 难 达 到 时 序 收敛 的 设计 目标 ， 好 处 
是 设计 编译 工作 可 以 很 快 地 顺利 完成 。 设 计 后 期 ， 当 设计 功能 接近 完善 之 际 ， 可 
以 选用 一 个 较 慢 的 FPCA 器 件 来 实现 设计 ， 以 降低 产品 的 成 本 。 


4.4.4 引 脚 


设计 需要 的 输入 /输出 (0) 接口 类 型 将 影响 FPCA 器 件 所 需要 的 引 脚 数 
目 和 封装 类 型 。 必 须知 道 所 需 的 0 标准 和 对 VO 驱动 强度 的 要 求 。 需 要 多 少 个 
引 脚 ? 电源 供电 要 求 是 什么 ”在 没有 开始 设计 时 ， 要 确定 这 些 要 求 是 好 和 弄 清楚 所 
使 用 的 FPGA 器 件 是 如 何 与 电路 板 接口 的 。 同 时 也 需要 关注 设计 中 的 信号 完整 性 
问题 。 设 计 中 是 否 存 在 大 量 引 脚 接口 可 能 同时 触发 的 情况 ， 如 果 有 的 话 ， 设 计 是 
否 存在 同时 开关 噪声 (Simultaneously Switching Noise，SSN) 问题 ?值得 注意 的 
是 ， 键 合 (wirebond) 封装 的 FPCA 器 件 通常 比 倒闭 〈fip chip) 的 FPCA 器 件 具 
有 更 差 的 信号 完整 性 和 IO 性 能 。 
建议 在 考虑 设计 的 引 脚 数 目 时 ， 为 系统 内 磐 调 试 预 留 一 些 引 脚 。 至 少 应 预 贸 
15% 的 FPGA 器 件 引 脚 ， 用 来 将 内 部 信号 引 到 芯片 外 供 逻 辑 分 析 仪 进行 分 析 。 


4.4.5 功 耗 


根据 设计 说 明 书 可 以 知道 设计 的 功 耗 预算 。FPCA 器 件 需要 多 少 种 电源 ?” 大 
多 数 现代 FPGA 器 件 要 求 有 多 个 电源 供电 ,为 IP 核 0O、 通 常 还 有 收发 右 提 供 
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各 自 独 立 的 电源 层 。FPGA 器 件 需要 的 电源 个 数 越 多 ， 电 路 板 上 元 融 件 成 本 就 越 
高 ， 电 路 板 设计 的 复杂 程度 就 越 高 。 

同样 ， 之 前 FPGA 的 设计 经 验 可 在 本 次 设计 的 功 耗 估算 中 发 挥 作用 。 本 书 的 
第 7 章 将 专门 介绍 功 耗 估计 ， 这 将 有 助 于 克服 这 一 难题 。 

总 之 ， 建 议 根据 FPCA 供应 商 提 供 的 功 耗 评估 软件 和 以 往 的 经 验 共 同 确定 设 
计 将 要 消耗 的 功 耗 。 


4.4.6 了 的 可 用 性 


在 某 一 FPCA 器 件 系列 上 已 有 的 IP 可 能 在 准备 选用 的 这 种 FPCA 器 件 系列 
中 还 没有 被 引入 或 没有 被 验证 。 这 是 新 投入 市 场 的 器 件 常 有 的 情况 。 当 FPGA 器 
件 的 硅 工 艺 只 有 不 到 6 个 月 时 间 时 ，IP 接口 往往 是 麻烦 。 这 些 FPGA 器 件 通 常 没 
有 完全 定型 ， 只 有 一 个 初步 的 时 序 模型 。 只 有 当时 序 模型 最 终 确定 的 时 候 ， 高 性 
能 IP 接口 的 时 序 收敛 才能 得 到 保证 。 


4.4.7 器件 的 可 用 性 


如 果 项 目 涉及 尖端 技术 ， 有 可 能 会 考虑 使 用 市 面 上 最 新 的 FPCA 融 件 。 最 新 
的 FPCA 器 件 在 将 来 价格 会 更 合理 一 些 。 如 有 果 设 计 将 在 12 个 月 之 内 投产 ,将 在 5 
年 后 批量 生产 。 那 么 这 样 在 进行 批量 生产 时 正 逢 所 使 用 的 FPCA 器件 工艺 成 熟 且 
其 价格 最 低 的 时 候 。 在 这 种 情况 下 ， 决 定 使 用 市 面 上 最 新 的 FPCA 带 件 在 经 济 上 
是 划算 的 。 


4.4.8 小 结 


为 了 快速 有 效 地 将 FPCA 器 件 和 虚拟 设计 融合 在 一 起 ， 实 话 实说 ， 我 们 建议 
设计 师 在 选择 FPCA 器 件 时 ， 局 动 以 上 成 功 的 FPCA 器件 选择 流程 。 这 样 ， 设 计 
师 将 对 器 件 需要 什么 类 型 的 接口 有 一 个 清晰 的 认识 ， 也 有 助 于 确定 引 脚 要 求 ， 从 
而 简化 VO 规划 。 通 过 创建 虚拟 设计 ， 设 计 师 将 对 FPGA 器 件 内 部 资源 的 利用 有 

个 总 体 概念 。 这 一 方面 可 以 为 达到 设计 的 性 能 指标 提供 指导 ， 还 能 使 设计 师 在 
设计 早期 就 进行 功 耗 评估 。 虚 拟 设计 应 包括 设计 中 将 用 到 的 每 一 个 卫 模 块 ， 它 
的 创建 有 助 于 设计 师 选 用 合适 的 FPCA 带 件 。 


让 


第 5 章 设计 环境 


5.1 引言 


为 了 顺利 地 完成 FPCA 系统 的 设计 ， 有 必要 把 所 有 的 设计 工具 、 技 术 和 设备 
组 合 在 一 起 形成 一 个 良好 的 氛围 ， 这 就 是 最 佳 的 FPGA 设计 环境 。 每 个 公司 的 
FPGA 设计 环境 通常 有 自己 的 特色 ， 可 以 满足 该 公司 的 特殊 需求 。 然 而 ， 不 同 公 
司 的 FPCA 设计 环境 之 间 也 存在 一 些 贯 穿 整个 设计 过 程 的 共同 要 素 。 本 章 的 目的 
就 是 让 您 了 解 按 进 度 计 划 顺 利 完成 FPCA 设计 项 目 对 设计 环境 的 最 低 要 求 。 设 计 
环境 可 表示 为 以 下 五 个 要 素 : 

1. 脚本 化 环境 ; 
. 与 版 本 控制 软件 之 间 的 交互 ; 
. 问题 跟踪 系统 的 使 用 ; 
. 回归 测试 系统 ; 
. 为 分 析 而 进行 的 数据 收集 。 


5.2 脚本 化 的 环境 


大 


FPGA 设计 工程 师 面临 的 挑战 之 一 是 在 FPGA 设计 过 程 中 ， 什 么 时 候 应 该 使 
用 脚本 化 的 设计 流程 ， 而 什么 时 候 应 该 使 用 图 形 界面 (CUI) 设计 环境 ? 

脚本 化 的 设计 流程 适用 于 以 下 五 种 情况 : 

1 项 目的 创建 ; 

2. 编写 设计 任务 分 工 的 说 明 书 ; 

3. 设计 的 编译 ， 尤 其 当 设计 者 使 用 计算 机 集群 环境 进行 编译 时 更 是 如 此 ， 
因为 使 用 脚本 化 编译 环境 ， 允 许 设计 者 通过 服务 器 ， 对 分 布 在 集群 环境 中 的 编译 
文件 进行 批 处 理 ; 

4. 功能 验证 和 回归 测试 ; 

5 与 版 本 控制 软件 的 结合 。 

以 上 这 五 个 方面 涵盖 了 FPCA 设计 的 大 部 分 流程 。 这 似乎 是 在 说 设计 流程 的 
每 一 阶段 都 值得 推荐 使 用 脚本 ， 但 这 个 观点 并 不 完全 正确 。 对 任何 重复 的 任务 ， 
确实 应 该 使 用 脚本 。 使 用 脚本 有 助 于 其 他 用 户 较 容易 地 重 现 原 设计 者 的 环境 和 结 
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采 。 

那么 ， 建 议 在 什么 时 候 使 用 图 形 界面 呢 ? 

图 形 界面 应 该 用 于 设计 流程 中 的 交互 部 分 。 也 就 是 那些 需要 根据 得 到 的 结果 
而 改变 操作 的 地 方 。 例 如 以 下 的 三 种 情况 : 

1. 设计 的 系统 内 部 调试 。 

2. 布局 操作 。 关 注 布局 的 细节 可 对 器 件 的 架构 和 可 用 资源 有 更 好 地 了 解 。 
布局 操作 还 可 以 在 基于 团队 的 设计 环境 的 布局 中 ， 为 用 户 的 设计 创建 一 个 物理 布 
局 。 

3. 开始 使 用 新 工具 时 。 图 形 界 面 为 建立 第 一 个 项 目 和 展示 工具 的 特性 及 功 
能 提供 了 一 个 很 好 的 方式 。 一 旦 熟练 掌握 了 这 个 工具 ， 建 议 将 设计 转移 到 脚本 化 
的 设计 环境 中 。 

脚本 程序 的 使 用 能 在 重复 的 任务 上 节省 时 间 和 精力 。 它 最 大 的 益处 之 一 是 在 
基于 团队 的 设计 中 简化 团队 各 成 员 间 的 任务 交接 。 如 果菜 人 从 另 一 个 工程 师 那 里 
接手 一 个 项 目 或 设计 模块 ;该 工程 师 不 必 为 了 得 到 设计 结果 而 编写 详细 的 说 明 来 
描述 需要 做 些 什 么 ， 只 需要 给 他 们 脚本 就 行 了 ， 因 为 脚本 本 身 就 是 文档 。 新 接手 
的 工程 师 看 懂 脚 本 之 后 运行 脚本 即 可 。 他 们 就 可 以 从 上 一 个 工程 师 停止 的 地 方 开 
台新 的 工作 了 。EDA 工具 作为 FPGA 设计 流程 一 部 分 ， 几 乎 都 有 脚本 接口 : 包 
括 创建 批 处 理 文件 的 命令 行 接口 和 在 项 目 中 创建 配置 的 分 配 脚本 。EDA 工业 界 
大 多 数 供应 商 已 将 TCL 作为 编写 其 EDA 工具 接口 的 标准 语言 ， 人 允许 TCL 脚本 调 
用 其 各 种 工具 。 


5.3 与 版 本 控制 软件 的 交互 


版 本 控制 软件 可 为 设计 的 修改 提供 历史 记录 。 当 正在 进行 某 项 FPGA 设计 
时 ， 有 必要 知道 在 版 本 控制 软件 中 需要 递交 (check in) 和 取出 (check out) 文 
件 的 最 小 集合 。 应 该 尽量 减少 这 些 文件 的 数量 ， 因 为 递交 的 文件 越 多 ， 所 需 的 存 
储 空间 就 越 大 ， 操 作 就 越 复杂 。 设 计 的 每 次 修改 ， 都 需要 将 整个 FPCA 项 目 递交 
到 版 本 控制 软件 中 。 而 一 个 好 的 脚本 环境 有 助 于 简化 这 一 过 程 。 脚 本 的 初始 设置 
和 所 需 递 交 、 取 出 文件 操作 和 确认 操作 过 程 可 能 十 分 复杂 。 然 而 ， 这 些 脚本 一 旦 
建立 后 ， 就 可 以 与 专注 该 项 目 开 发 的 工程 师 们 共享 。 如 果 能 用 脚本 重建 项 目 或 描 
述 项 目 ， 与 版 本 控制 软件 间 的 交互 将 会 变 得 简单 得 多 。 

为 重 现 结果 ， 不 同 的 FPGA 设计 工具 要 求 把 不 同 的 文件 集 置 于 版 本 控制 软件 
中 ; 因此 ， 当 使 用 不 同 FPGA 厂商 提供 的 设计 工具 时 ， 版 本 控制 软件 的 设置 可 能 
显著 不 同 。 而 原则 却 都 是 一 样 的 。 若 EDA 工具 使 用 文本 文件 ， 则 它 与 版 本 控制 
系统 之 间 的 交互 将 变 得 十 分 简单 。 若 EDA 工具 使 用 二 进 制 文件 保存 关键 信息 ， 
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则 它 与 版 本 控制 系统 的 交互 将 变 得 比较 复杂 。 

为 了 使 设计 师 能 重 现 以 前 的 编译 结果 ， 究 竟 需 要 把 哪些 文件 递交 到 版 本 控制 
软件 中 去 处 理 呢 ? 直到 今天 ， 有 关 这 项 商业 机 密 的 公开 发 布 工作 ，FPCA 厂商 仍 
旧 做 得 很 差 。 如 果 在 FPGA 设计 流程 中 使 用 了 多 种 工具 ， 这 个 过 程 将 变 得 更 加 复 
杂 。 为 了 理解 他 们 推荐 的 好 办 法 ， 建 议 设计 师 与 各 工具 的 供应 商 接洽 。 

设计 环境 中 所 使 用 的 目录 结构 对 如 何 使 用 版 本 控制 软件 而 言 至 关 重要 。 设 计 
环境 的 目录 结构 中 包括 了 RTL 设计 文件 的 位 置 、RTL 库 和 IP 库 的 位 置 、 知 使 用 
软 处 理 器 还 有 C 代码 和 程序 存储 区 的 位 置 、 仿 真 测试 平台 的 位 置 、 寄 存 器 测试 
结果 的 储存 位 置 ， 以 及 在 FPGA 软件 或 其 他 EDA 软件 中 用 来 编译 设计 的 脚本 文 
件 所 在 的 位 置 。 为 了 能 使 用 这 些 文件 的 正确 版 本 ,必须 将 所 有 这 些 要 素 顺利 地 连 
接 在 一 起 。 

在 实验 室 中 调试 设计 时 应 该 避免 发 生 以 下 这 些 情况 : 在 FPGA 上 使 用 了 错误 
的 固件 代码 、 在 软 处 理 器 上 加 载 了 旧 的 源 代码 、 设 计 师 修改 的 RTL 文件 的 版 本 
已 经 过 时 。 正 确 使 用 版 本 控制 软件 提供 了 一 个 可 以 防止 类 似 情 况 的 发 生 。 因 为 报 
告 文件 能 说 明 设 计 的 状态 ， 所 以 应 该 把 报告 文件 也 保存 在 版 本 控制 软件 中 ， 这 将 
为 从 事 同 一 项 目 开发 的 其 他 设计 师 们 提供 有 价值 的 信息 。 


5.4 问题 跟踪 系统 的 使 用 


问题 跟踪 系统 不 列 在 FPGA 厂商 的 供 货 清单 上 。 但 是 ， 能 表 定 的 是 问题 跟踪 
系统 是 一 个 工具 ，FPGA 厂商 使 用 它 作 为 他 们 的 工程 和 产品 规划 过 程 的 一 部 分 。 
为 了 满足 各 个 公司 的 需要 ， 问 题 跟踪 系统 往往 在 公司 内 部 自主 开发 。 实 际 上 许多 
EDA 工具 供应 商 和 FPGA 厂商 都 有 一 个 用 户 到 它们 系统 的 接口 ， 用 于 提交 问题 
报告 。 

市 场 上 可 以 购买 到 商业 化 的 问题 跟踪 系统 。 这 些 问 题 跟 踪 系 统 本 质 上 是 数据 
库 系 统 ， 只 是 为 了 满足 不 同 公司 的 需要 而 添置 了 一 个 可 定制 的 前 端 。 在 您 的 设计 
环境 中 ， 您 将 使 用 该 跟踪 系统 去 跟踪 FPGA 设计 中 所 有 已 知 的 问题 。 这 使 设计 工 
程 师 们 能 在 设计 出 现 问题 时 把 它们 记录 下 来 。 问 题 跟 踪 系 统 为 设计 团队 提供 设计 
的 即时 状态 ， 并 能 在 整个 设计 过 程 中 用 来 跟踪 设计 的 稳定 性 。 它 使 得 团队 中 其 他 
成 员 可 以 知道 您 设计 中 所 存在 的 问题 ， 从 而 避免 发 生 以 下 情况 ， 即 他 们 费力 地 调 
试 自己 那 部 分 系统 出 现 的 一 个 问题 ， 而 这 个 问题 是 由 您 的 设计 而 引起 的 。 通 过 人 研 
究 这 些 资料 ， 可 以 决定 是 否 使 用 由 于 这 个 问题 而 导致 的 特殊 情形 ， 还 是 恢复 到 原 
先 这 个 问题 还 没有 显现 时 的 情形 。 

问题 跟踪 系统 还 允许 用 户 详细 记录 问题 是 如 何 解 决 的 。 这 使 得 团队 成 员 之 间 
互相 合作 一 起 解决 设计 中 出 现 的 问题 非常 方便 。 这 对 跨越 多 个 时 区 基于 团队 的 设 
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计 环 境 非常 有 帮助 。 

如 上 所 述 ， 我 们 可 以 用 问题 跟踪 系统 给 项 目的 健康 状况 拍 快照 。 为 了 做 到 这 
一 点 ， 问 题 跟踪 系统 必须 与 回归 测试 系统 相 结合 ， 这 样 每 次 回归 测试 失败 后 ， 将 
对 照 被 测试 的 情形 把 问题 跟踪 系统 中 的 问题 报告 自动 归档 。 


5.5 回归 测试 系统 


作为 测试 的 一 部 分 ， 设 计 工 程 师 需要 创建 测试 点 以 证 明 自 己 的 设计 符合 功能 
要 求 。 想 要 为 设计 提供 健康 检测 ， 必 须 拥有 一 组 经 常 在 设计 上 运行 的 测试 。 这 些 
测试 使 您 拥有 这 样 的 信心 ， 即 在 今后 的 设计 修改 中 ， 不 会 再 引入 以 前 出 现 过 的 问 
题 ， 也 不 会 破坏 现 有 的 功能 。 在 第 11 章 中 我 们 将 会 更 详细 地 讨论 回归 测试 问题 。 


5.6 何 时 升级 FPGA 设计 工具 的 版 本 


FPGA 三 商 通常 每 年 至 少 发 布 两 次 有 较 多 修改 的 新 版 本 ， 并 附带 一 组 补丁 
包 ， 其 中 包含 程序 错误 修复 和 时 序 模型 修正 等 补丁 。 如 果 有 一 项 持续 时 间 超 过 6 
个 月 的 设计 ， 项 目 管理 者 不 能 不 回答 这 样 的 问题 : 何 时 采用 FPGA 设计 环境 中 最 
近 发 布 的 设计 工具 新 版 本 ?什么 时 候 却 应 该 保持 您 正在 使 用 的 设计 工具 的 版 本 不 


变 ? 


这 个 问题 的 回答 取决 于 当 FPGA 设计 工具 版 本 更 新 时 ， 设 计 正 处 于 流程 中 的 
哪个 阶段 。 如 果 正 处 于 设计 的 早期 阶段 ， 就 应 随时 升级 到 FPGA 设计 软件 的 最 新 
版 本 ， 除 非 知道 新 软件 有 严重 的 问题 。 这 样 可 以 在 新 版 本 软件 中 获得 最 新 的 错误 
修复 和 最 新 的 功能 。 大 多 数 FPGA 设计 软件 的 新 版 本 通常 在 一 定 程度 上 会 缩短 编 
译 时 间 。 

奉 设 计 即 将 完工 ， 而 且 您 正在 使 用 的 这 个 FPGA 厂商 所 提供 的 软件 版 本 含有 
目标 器 件 最 终 的 时 序 模型 ， 则 应 考虑 保持 正在 使 用 的 设计 软件 版 本 不 变 。 有 一 个 
例外 就 是 知 正 巧遇 到 设计 软件 中 的 一 个 错误 ， 它 影响 了 设计 进度 ， 则 为 了 修复 这 
个 错误 ， 可 能 不 得 不 升级 设计 工具 。 

如 果 您 的 设计 即将 完工 ,但 FPGA 厂商 提供 的 仍 是 初级 的 基本 时 序 模型 ， 一 
旦 有 了 最 终 时 序 模型 ， 设 计 软 件 必须 升级 到 新 版 本 。 设 计 软件 的 升级 可 能 会 遇 到 
问题 ， 因 为 供应 商 提 供 的 IP 模块 很 可 能 也 要 跟着 升级 ， 这 将 增加 许多 工作 量 ， 
尤其 在 设计 验证 过 程 中 更 是 如 此 。 强 烈 建议 对 照 产品 或 最 终 版 本 的 FPCA 时 序 模 
型 进行 设计 验证 。 

有 些 FPCA 厂商 提供 的 设计 工具 可 以 用 高 版 本 软件 读 取 低 版 本 软件 中 的 设计 

数据 库 。 因 此 ， 为 验证 在 改 用 新 发 布 的 最 终 时 序 模型 的 情况 下 ， 设 计 是 否 仍然 能 
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满足 时 序 需 求 ， 并 不 需要 重新 编译 设计 ， 只 需 重 新 运行 时 序 分 析 即 可 。 
5.7 FPGA 设计 环境 中 常用 的 工具 


FPGA 设计 软件 : FPGA 设计 软件 来 自 FPGA 厂商 ， 其 中 包括 FPGA 布局 布线 
软件 和 时 序 分 析 工 具 。 主 要 的 FPGA 厂商 也 提供 RTL 综合 工具 、 高 级 时 序 收 敛 
工具 、 片 上 调试 工具 ， 以 及 布局 工具 。 

FPGA 综合 软件 : FPCA 综合 软件 可 能 来 自 FPCA 厂商 ， 也 可 能 来 自 EDA 综 
合 工 具 供应 商 ， 诸 如 新 思科 技 公司 (Synopsys) 或 明 导 国际 ( Mentor Craphics ) 。 
大 多 数 FPGA 综合 工具 支持 Verilog 和 VHDL， 现 在 一 些 FPGA 综合 工具 也 支持 
System Verilog。 

仿真 工具 : 有 些 FPCA 厂商 提供 仿真 工具 ， 但 至 今 为 止 所 使 用 的 仿真 工具 中 
的 大 多 数 来 自 EDA 工具 供应 商 。 其 中 最 流行 的 工具 是 Mentor 的 Modelsim 和 
Questasim 、Synopsys 的 VCS 、Cadence 的 Incisive， 以 及 Aldec 的 Active HDL 和 
Riviera Pro。 有 些 工 具 包 含 了 一 些 高 级 功能 ， 诸 如 基于 验证 的 断言 、 跨 时 钟 域 的 
检测 等 。 

形式 验证 工具 : 在 FPGA 设计 过 程 中 通常 不 使 用 形式 验证 工具 ， 这 是 因为 这 
类 工具 在 执行 优化 时 所 设置 的 一 些 限 制 。 为 了 顺利 地 完成 验证 ， 在 使 用 这 些 工具 
时 ， 可 以 对 其 执行 优化 。 

时 序 分 析 工 具 : EDA 工具 供应 商 提供 了 几 种 时 序 分 析 工 具 。 然 而 ， 由 于 FP- 
GA 厂商 也 提供 自己 的 时 序 分 析 工 具 ， 所 以 EDA 工具 供应 商 提 供 的 时 序 分 析 工 具 
很 少 用 于 FPGA 设计 流程 中 。 建 议 使 用 FPGA 厂商 的 时 序 分 析 工 具 进 行 FPGA 的 
时 序 分 析 ， 这 是 因为 用 做 时 序 签收 的 时 序 约束 ， 还 可 以 用 于 布局 布线 的 优化 。 
建议 在 FPGA 验证 中 不 要 使 用 EDA 时 序 分 析 工 具 ， 而 在 电路 板 的 时 序 分 析 
中 要 使 用 EDA 时 序 分 析 工 具 。 

电路 板 设 计 工 具 : EDA 工具 用 于 电路 板 设 计 中 。 它 们 包括 电路 板 原 理 图 工 
有 具 、 电 路 板 布局 布线 工具 和 信号 完整 性 工具 。 在 信号 完整 性 工具 中 使 用 的 
HSPICE 和 IBIS 模型 来 自 FPGA 厂商 。 

高 层次 综合 : 这 个 领域 的 大 多 数 工具 都 是 处 理 用 “C” 语 言 或 “C ++” 语 
言 编写 的 设计 模型 ， 综 合 后 产生 与 之 对 应 RTL 级 代码 或 FPGA 网 表 。 这 些 工具 
在 FPGA 市 场 上 被 接受 的 进程 一 直 很 缓慢 。 这 些 工 具 已 经 成 熟 了 许多 ， 它 们 在 某 
些 应 用 领域 的 设计 中 正在 缓慢 地 取得 进展 ， 而 在 创建 完整 的 FPCA 设计 方面 ,无 
显 车 进展。 这 些 工 具 主要 集中 在 高 性 能 计算 领域 和 DSP 算法 的 实现 领域 。 

所 有 这 些 产 品 均 由 EDA 公司 提供 。 

下 一 类 型 的 高 层次 综合 工具 是 基于 模型 的 设计 工具 。 这 些 基 于 模型 的 高 层次 
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综合 工具 使 用 Mathworks Simulink 环境 中 的 优化 库 ， 它 们 的 目标 市 场 是 军 方 和 调 
制 解 调 器 设计 。 这 些 工具 依赖 于 Mathworks Matlab 环境 。 可 以 从 主要 的 FPGA 厂 
商 和 EDA 公司 购买 到 这 些 高 层次 综合 工具 。 

负载 分 配 软 件 : 该 软件 用 于 调度 正在 计算 机 集群 中 处 理 的 作业 。 负 载 调度 分 
配 的 解决 方案 在 FPCA 开发 案例 中 经 常 使 用 ， 尤 其 在 基于 脚本 的 设计 流程 中 更 是 
如 此 。 负 载 分 配 软件 有 商用 软件 包 ， 也 有 人 免费 软件 。FPGA 软件 中 的 一 些 选项 包 
含 了 某 些 形式 的 负载 分 配 软 件 。 

版 本 控制 软件 ， 版 本 控制 工具 虽 不 属于 EDA 工具 范畴 ， 但 却 是 设计 流程 中 
相当 重要 的 环节 。FPGA 设计 中 常用 的 版 本 控制 软件 有 Clearcase 、Perforce 和 
PVCS。 
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6.1 FPGA 器 件 给 电路 板 设计 带 来 的 挑战 


为 了 满足 当今 系统 设计 高 性 能 和 高 带宽 要 求 ，FPCA 器 件 提供 了 大 量 的 引 
脚 ， 并 且 引 脚 的 开关 速度 越 来 越 快 。 封 装 引 脚 数 的 增加 ， 加 上 器 件 支 持 许多 不 同 
的 WO 标准 和 封装 类 型 ， 这 个 实际 情况 给 顺利 、 高 效 、 正 确 地 创建 FPGA 器 件 的 
引 脚 带 来 了 巨大 的 困难 。 修 改 引 脚 分 配 会 导致 电路 板 的 多 次 改版 ， 从 而 造成 成 本 
的 增加 ， 耽 误 项 目的 进度 ， 其 代价 十 分 昂贵 。 

FPGA 器 件 可 提供 灵活 的 引 脚 ， 并 支持 多 种 不 同类 型 的 LO 标准 ， 人 允许 用 户 
对 引 脚 的 驱动 能 力 和 翻转 率 加 以 控制 。 这 一 灵活 性 导致 了 合理 分 配 FPCA 引 脚 的 
复杂 规则 ， 从 而 对 FPGA 与 印 制 电 路 板 (Printed Cireuit Board，PCB) 的 连接 设 
计 提 出 了 新 的 要 求 。 

由 于 FPCA 封装 的 引 脚 数 十 分 庞大 ， 从 而 造成 EDA 工具 流程 中 PCB 设计 软 
件 和 FPGA 设计 软件 之 间 数 据 管理 方面 的 困难 。 

由 于 高 性 能 PCB 设计 的 复杂 性 ， 所 以 PCB 设计 必须 在 系统 设计 的 早期 就 开 
始 执行 。 这 造成 FPGA 的 最 终 引 脚 与 PCB 设计 周期 协调 一 致 的 困难 。 通 常 电路 
板 要 早 于 FPGA 设计 完成 其 布局 布线 。 但 实际 上 ， 目 前 FPCA 和 PCB 设计 同时 开 
工 正 变 得 越 来 越 普遍 ， 而 对 许多 系统 设计 师 而 言 ，PCB 的 设计 经 常 在 FPGA 的 
RTL 级 代码 存在 之 前 就 已 经 完成 了 ! 

在 设计 周期 的 初期 ， 项 目 所 需 的 FPGA 器 件 规模 的 大 小 很 难 预测 。 针 对 这 个 
问题 ， 大 多 数 FPGA 需 件 系列 都 有 其 技术 解决 方案 , 即 文 持 封装 相同 、 规 格 不 同 
的 FPGA 器 件 之 间 的 引 脚 兼容 。 因 此 ， 建 议 设 计 者 在 封装 相同 、 有 多 种 规格 的 某 
个 系列 中 选择 合适 的 FPGA 器 件 。 对 PCB 设计 师 而 言 ， 在 不 同 规格 FPCA 的 每 种 
器 件 中 达到 引 脚 兼容 十 分 困难 。 然 而 ， 上 一 章 已 经 提 到 ， 有 些 FPGA 设计 工具 通 
过 一 个 通常 称 为 器 件 移植 的 功能 ， 可 以 方便 地 为 用 户 提供 帮助 。 顺 件 移植 是 将 设 
计 从 一 个 FPGA 器 件 转移 到 同一 系列 中 某 个 封装 相同 、 规 格 不 同 的 FPCA 器 件 上 
的 能 力 。 在 保持 电路 板 布局 布线 和 引 脚 分 配 不 变 的 前 提 下 ， 嚣 件 移植 能 使 设计 从 
其 原本 的 目标 器 件 转移 到 另 一 个 引 脚 相 同 ， 而 规格 不 同 的 器 件 上 。 当 选择 FPCA 
器 件 时 ， 用 户 可 在 FPGA 厂商 提供 的 软件 中 选择 移植 功能 。 该 功能 可 以 防止 用 户 
在 分 配 引 脚 时 误 用 同一 系列 不 同 规格 器 件 之 间 不 兼容 的 引 脚 。 由 于 FPCA 设计 中 
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很 可 能 发 生 无 法 预知 的 变化 ， 为 了 保险 起 见 ， 建 议 将 引 脚 兼容 要 求 纳 入 设计 规 
划 ， 特 别 是 在 FPGA 设计 早期 确定 引 脚 的 时 候 更 要 注意 。 当 设计 需要 修改 而 导致 
逻辑 规模 显著 增 大 时 ， 引 脚 兼容 技术 使 设计 换 用 规格 大 一 些 的 FPGA 器件 成 为 可 
能 ， 或 者 只 要 设计 的 规模 允许 ， 还 可 以 换 用 规格 小 一 些 、 价 格 也 便宜 一 些 的 FP- 
GA 器 件 。 

系统 性 能 的 提升 和 带宽 的 增 大 对 引 脚 的 速率 提出 了 更 高 的 要 求 。FPGA 需 件 
能 以 533MHz 的 高 速率 ， 通 过 64bits 的 DDR 3 SRAM 接口 向 SRAM 写 人 数据 。 每 
个 引 脚 的 数据 率 高 达 1067Mbit/s。 这 将 使 FPCA 器 件 大 量 的 引 脚 同时 发 生 翻 转 ， 
引 脚 同 时 翻转 所 产生 的 噪声 又 会 导致 器 件 功能 失 致 。 因 此 ，FPCA 器 件 必须 拥有 
能 避免 同时 翻转 噪声 (SSN) 的 引 脚 ， 而 且 FPGA 器 件 的 引 脚 与 电路 板 连接 时 也 
必须 避免 SSN 问题 。 

许多 FPGA 器 件 还 包含 速率 高 达 11.3Gbit/s 的 收发 模块 ， 并 且 支 持 多 种 IO 
协议 ， 例 如 PCI EXPRESS ，Serial RapidI0® ，Gigabit Ethernet (GbE) 等 。 基 于 高 
速 收发 器 的 接口 与 电路 板 连 接 时 必须 小 心 谨 屠 ， 以 避免 信号 完整 性 〈Signal In- 
tegrity ，SI) 问题 。 

现在 我 们 已 经 认识 到 设计 一 块 包含 FPCA 器 件 的 高 性 能 系统 PCB 所 潜在 的 
风险 ， 因 而 将 重点 放 在 那些 可 用 来 确保 PCB 设计 一 次 成 功 的 技术 上 。 本 章 其 余 
部 分 将 详细 地 描述 高 速率 PCB 设计 所 面临 的 困难 ; 介绍 PCB 设计 过 程 中 的 小 组 
分 工 。 本 章 其 余部 分 还 提出 一 套 应 对 所 有 这 些 困 难 的 方法 学 ， 最 后 总 结 出 一 套 可 
用 于 任何 FPGA 项 目 使 FPGA 的 引 脚 分 配 和 PCB 设计 获得 圆满 成 功 的 要 诀 。 


6.2 工程 师 的 角色 和 职责 


参与 包含 FPCA 器 件 的 系统 电路 板 设 计 的 工程 师 ， 可 以 按 专业 分 成 三 个 不 同 
的 小 组 ， 即 FPGA 组 、PCB 组 和 信和 号 完整 性 组 。 在 某 些 机 构 中 ， 他 们 的 功能 有 交 
集 ， 但 总 体 上 ， 由 于 专业 学 科 不 同 ， 不 同 工 程 师 或 者 工程 师 小 组 所 履行 的 职责 也 
不 同 oO 


6.2.1 FPGA 工程 师 


FPGA 工程 师 们 熟悉 FPGA 设计 软件 。 这 些 FPCA 工程 师 通常 负责 编写 和 验 
证 设计 的 RTL 代码; 也 负责 在 FPCA 中 实现 设计 ， 并 在 最 终 系统 中 帮助 调试 设 
计 。 

在 PCB 设计 中 ，FPGA 工程 师 继续 发 挥 着 作用 。 他 负责 从 FPGA 设计 软件 中 
生成 FPGA 的 引 脚 分 配 图 。 因 此 ，FPGA 工程 师 应 与 PCB 工程 师 密切 配合 ， 根 据 
PCB 设计 工程 师 提 出 的 建议 ， 及 时 修改 FPGA 设计 ， 更 新 引 脚 分 配 ， 并 验证 所 做 
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的 改动 。 
FPCA 工程 师 还 要 与 信号 完整 性 工程 师 密切 配合 ， 为 他 提供 由 FPCA 设计 软 
件 生成 的 FPGA 引 脚 分 配 图 、HSPICE 模型 、IBIS 模型 ， 以 及 网 表 。 


6.2.2 PCB 设计 工程 师 


PCB 设计 工程 师 熟 悉 PCB 原理 图 软件 和 布局 布线 软件 ， 通 常 负责 创建 电路 
板 原理 图 ， 其 中 包括 器 件 符号 的 生成 。 同 时 他 还 负责 电路 板 的 布局 布线 。 电 路 板 
的 布局 ， 特 别 是 电路 板 的 布线 基本 上 取决 于 电路 板 上 元 器 件 的 引 脚 分 配 。 由 于 
FPGA 的 引 脚 分 配 会 严重 影响 PCB 设计 工程 师 的 工作 进度 ， 同 时 也 潜在 影响 电路 
板 的 成 本 ， 因 此 PCB 设计 工程 师 在 很 大 程度 上 会 去 影响 FPGA 的 引 脚 分 配 。 虽 
然 PCB 设计 工程 师 对 FPCA 器 件 的 引 脚 分 配 会 产生 很 大 的 影响 ， 但 他 通常 没有 
使 用 FPGA 设计 软件 的 想法 。 这 使 得 在 FPCA 设计 师 和 PCB 设计 师 之 间 必 须 建立 
传递 信息 的 有 效 手 段 。 这 实际 上 是 一 个 双向 的 需求 机 制 ， 即 从 EDA 工具 厂商 那 
里 购买 的 FPGA 设计 软件 和 电路 原理 图 设计 软件 之 间 的 双向 接口 机 制 。 如 今 ， 有 
些 EDA 工具 厂商 提供 了 与 FPCA 设计 软件 的 双向 接口 。 然 而 ， 在 这 两 类 工程 师 
之 间 进 行 信息 交流 的 最 常用 的 接口 却 是 Microsoft Excel。 大 多 数 FPGA 厂商 提供 
的 FPGA 设计 软件 具有 读 写 .csv 格式 文件 的 能 力 ， 可 以 与 Microsoft Excel 接口 。 
同样 ， 有 些 原理 图 软件 包 也 能 读 .csv 格式 文件 。 工 业界 电路 板 设计 师 的 普遍 做 
法 是 创建 一 个 脚本 ， 从 . esy 格式 文件 或 者 FPGA 软件 的 引 脚 报告 中 生成 相应 的 
原理 图 符号 。 因 此 ，. csv 格式 文件 有 多 种 用 途 ， 下 面 列 出 了 其 中 两 种 : 

1. 该 文件 可 用 于 把 FPGA 设计 文件 和 它 的 电路 板 设计 文件 合并 为 一 个 整 
体 。 

2. 该 文件 可 用 于 说 明 引 脚 的 分 配 。 因 此 ， 它 应 当 被 保存 在 版 本 控制 软件 


中 。 
下 面 列 出 了 一 个 .esy 文件 示例 ， 该 示例 文件 用 于 说 明 FPCA 设计 软件 和 电 
路 板 原理 图 软件 间 的 接口 ， 详 例如 图 6-1 所 示 。 
其 要 点 是 . csv 文件 包含 了 LO 标准 和 电流 强度 的 许多 细节 ， 它 比 引 脚 分 配 
文件 要 详细 得 多 。1/O 标准 和 电流 强度 的 细节 会 影响 电路 板 上 的 信号 质量 ， 也 会 
影响 10 的 时 序 。 
PCB 设计 工程 师 必 须 与 信号 完整 性 设计 工程 师 沟 通 ， 为 他 们 提供 电路 板 布局 
的 具体 细节 ， 以 便 信号 完整 性 设计 工程 师 建立 该 电路 板 的 信号 完整 性 模型 。 


6. 2.3 信号 完整 性 设计 工程 师 


信号 完整 性 (SI) 设计 工程 师 应 该 熟悉 来 自 领先 的 EDA 厂商 (例如 新 思科 
技 公司 (Synopsys) 、 明 导 国 际 (Mentor Graphics ) 、 安 捷 伦 (Agilent) 等 ) 的 信 
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号 完整 性 仿真 软件 。 他 们 负责 验证 信号 的 质量 (例如 过 冲 / 下 冲 )， 并 将 同步 翻 
转 噪声 (SSN) 控制 在 规定 的 范围 之 内 。 总 而 言 之 ，SI 工程 师 负 责 验 证 电路 板 的 
时 序 是 否 达 到 系统 的 要 求 。 


Pin Name Direction Location IO Bank VREF Group IO Standard Current Strength 
clk_in Input PIN_B13 4B4 N1 3.3-VLVTTL(default) 24mA(default) 
in_port to the button pio[3] Input PIN_AE6 8B8 N1 3.3-VLVTTLdefault) 24mA(defaulb) 
in_port to the button pio[2] Input PIN_AB10 8B8 N1 3.3-VLVTTL(default) 24mA(defaulb) 
in_port to the button pio[l] Input PIN AA10 8B8 NI1 33-VLVTTLdefaulb) 24mA(default) 
in_port to_ the button pio[0] Input PIN_Y11 8B8 N1 3.3—-VLVTTL(default) 24mA(default) 
ext flash_enet_bus_data[7] Bidir PIN_A8 3B3 NO 3.3-VLVTTL(default) 24mA(default) 
ext_flash_enet_bus_data[6] Bidir PIN_B8 3B3 NO 3.3-VLVTTL(default) 24mA(default) 
ext_flash_enet_bus_data[5] Bidir PIN_C8 3B3 N1 3.3-VLVTTL(default) 24mA(default) 
ext_flash_enet_bus_data[4] Bidir PIN_D9 3B3 N1 3.3-VLVTTL(default) 24mA(default) 
ext flash_enet_ bus data[3] Bidir PIN_G10 3B3 N1 3.3-VLVTTL(default) 24mA(default) 
ext flash_ enet_ bus_ data[2] Bidir PIN_F10 3B3 N1 3.3-VLVTTL(default) 24mA(defaulb 
ext flash enet_bus data[1] Bidir PIN_C8 3B3_N1 3.3-VLVTTL(default) 24mA(default) 
ext_flash_enet bus_data[0] Bidir PIN_D8 3B3 N1 3.3-VLVTTL(default) 24mA(default) 
out_port_from_the led_pio[7] Output PIN_AA11 8B8 N1 1.8V 12mA(default) 
out_port from the led pio[6] Output PIN_AF7 8B8 N1 1.8V 12mA(default) 
out port from the led pio[5] Output ”PIN_AE7 8B8 N1 1.8V 12mA(default) 
out_port from the led pio[4] Output PIN_AF8 8B8 NO 1.8V 12mA(default) 
out_port from the led pio[3] Output PIN_AE8 8B8 NO 1.8V 12mA(default) 
out_port from the led pio[2] Output PIN_W12 8B8 NO 1.8V 12mA(default) 
out port from the led pio[l] Output PIN_W11 8B8 NO 1.8V 12mA(default) 
out_port from the led pio[0] Output PIN_AC10 8B8 NO 1.8V 12mA(default) 


图 6-1 表明 电路 板 设 计 软 件 与 FPGA 设计 软件 接口 的 .csv 文件 

在 过 去 ， 大 多 数 FPGA 设计 没有 信和 号 完整 性 设计 工程 师 的 参与 。 事 实 上 ， 现 
在 许多 FPGA 设计 仍然 没有 信和 号 完整 性 设计 工程 师 的 参与 。 当 与 FPCA 器 件 接口 
时 ， 电 路 板 设计 师 往往 采用 保守 的 方法 进行 布局 ， 并 假定 这 种 方式 可 以 达到 设计 
要 求 ， 这 在 大 多 数 情况 下 是 适用 的 。 然 而 ， 基 于 本 章 前 面 提 到 的 理由 ， 这 种 方法 
已 经 不 再 适合 系统 设计 的 要 求 了 。 随 着 诸如 DDR 2/3 SRAM 这 些 类 型 的 存储 器 
接口 的 WO 速度 的 增加 ， 还 有 高 速 收 发 模块 ， 都 要 求 与 电路 板 正确 地 端 接 ， 以 防 
止 出 现 SI 和 SSN 问题 。 

按照 FPGA 厂商 提供 的 应 用 操作 说 明 书 中 所 提供 的 准则 ， 可 以 顺利 地 设计 出 
这 些 类 型 的 接口 。 然 而 ， 由 于 每 个 PCB 的 设计 有 差异 ， 建 议 SI 设计 工程 师 对 具 
有 高 性 能 要 求 的 输入 /输出 进行 仿真 。 这 要 求 SI 设计 工程 师 、FPGA 设计 师 及 
PCB 设计 师 之 间 要 进行 充分 的 沟通 。5I 设计 工程 师 需 要 FPGA 设计 师 提 供 
HSPICE 模型 和 IBIS 模型 ， 电 路 板 设计 师 需 要 提供 电路 板 布局 布线 等 具体 细节 。 
SI 仿真 往往 需要 很 长 时 间 ， 因 而 只 能 对 那些 在 信号 完整 性 上 存在 高 风险 的 FPGA 
引 脚 进行 仿真 。 这 是 使 设计 的 输入 /输出 达到 高 性 能 的 保证 。 

图 6-2 详细 地 介绍 了 FPGA 设计 周期 中 的 每 个 阶段 ， 不 同 专业 学 科 的 工程 师 
应 该 在 整个 设计 过 程 中 ， 自 始 至 终 地 参与 每 一 阶段 的 工作 。 在 本 章 中 关于 创建 
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FPCA 引 脚 设计 流程 的 小 节 , 将 对 图 6-2 有 更 加 详细 的 解释 。 


主板 规格 引 脚 交付 PCB 设 计 与 验证 PCB 设计 完成 

电路 板 
工程 师 

早期 引 脚 规划 质量 检验 、 调 

RTL 设 计 & 验 证 与 实现 试 与 工程 更 改 

FPGA 
工程 师 

早期 SI 分 析 ”基于 实际 电路 板 布线 的 SI 分 析 
信和 号 完整 性 
(SD 工程 师 


> 


研发 时 间 
图 62 设计 周期 中 不 同 专业 学 科 参 与 的 详细 情况 图 


6.3 功 耗 和 散热 问题 


FPGA 的 功 耗 估计 有 助 于 指导 电路 板 的 电源 设计 。 
6.3.1 滤 除 电源 噪声 


为 了 减少 系统 噪声 ， 用 一 个 干净 而 且 均 匀 分 布 的 电源 为 电路 板 上 所 有 的 器 件 
供电 至 关 重 要 。 在 电源 线 连接 到 PCB 节点 的 附近 放置 一 个 100mF 的 电解 电容 ， 
可 以 滤 除 低频 电源 噶 声 。 硅 使 用 稳 压 涡 ， 则 应 在 最 后 为 右 件 提供 电源 的 Vec 和 地 
之 间 跨 接 电 容 。 

为 了 减少 电源 层 的 高 频 噪声 , 去 而 电容 应 该 跨 接 在 电源 Vcc 和 地 线 之 间 ， 并 
尽 可 能 地 靠近 器 件 。 


6.3.2 电源 分 配 


在 电路 板 上 进行 电源 分 配 可 使 用 电源 总 线 网 络 或 电源 层 。 虽 然 电 源 总 线 网 络 
是 最 廉价 的 解决 方案 ,但 它 会 引起 电源 压 降 ， 所 以 这 种 方案 只 适合 用 于 低 成 本 的 
双 层 电路 板 ， 如 成 本 比较 宽松 就 应 该 考虑 使 用 电源 层 方案 。 
建议 使 用 两 层 或 更 多 电源 层 的 方案 。 电 源 层 应 该 覆盖 电路 板 整 个 区 域 ， 可 以 
将 电源 电压 Vec 均衡 地 分 配给 安装 在 不 同位 置 上 的 所 有 器 件 ， 这 个 方案 可 提供 良 
好 的 噪声 防护 。 建 议 把 模拟 电源 层 和 数字 电源 层 分 开 ， 不 要 共用 一 个 电源 层 。 现 
实 中 所 有 的 FPCA 器 件 都 包含 锁 相 环 (PLL) 模块 ， 因 此 在 电路 板 的 设计 中 必须 
为 FPCA 器 件 分 别提 供 模拟 电源 层 和 数字 电源 层 。 

总 而 言 之 ， 对 电源 分 配 的 建议 如 下 : 
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一 用 两 个 独立 的 电源 层 ， 把 数字 电源 层 和 模拟 电源 层 分 开 ; 
一 在 锁 相 环 (PPL) 的 电源 层 旁 放置 一 个 接地 层 ; 

一 对 锁 相 环 (PPL) 的 电源 进行 布线 时 ， 避 免 使 用 多 个 信号 层 ; 
一 将 数字 顺 件 和 模拟 器 件 连接 到 它们 各 自 的 接地 层 上 ; 

一 将 锁 相 环 (PPL) 的 模拟) 电源 和 数字 电源 隔离 。 


6.4 信号 的 完整 性 


传统 的 数字 设计 通常 不 需要 考虑 传输 线 效 应 产生 的 影响 。 但 随 着 系统 速度 的 
提高 ， 信 号 频率 变 得 越 来 越 高 ， 从 而 对 系统 造成 影响 。 这 意味 着 设计 者 不 仅 要 考 
虑 系统 的 数字 属性 ， 还 必须 考虑 高 频 信 号 对 系统 产生 的 模拟 效应 。 随 着 VO 接口 
和 存储 髓 接口 数据 率 的 增加 ， 特 别 是 舱 入 在 FPCA 器 件 中 的 高 速 收发 技术 的 应 
用 ， 可 能 使 得 高 频 信号 的 模拟 效应 变 得 尤为 突出 。 传 输 线 效 应 可 能 对 正在 发 送 的 
数据 产生 显著 的 影响 。 然 而 ， 随 着 传输 速率 的 提高 ， 高 频 效应 占据 了 主导 地 位 ， 
即便 最 短 的 电路 也 会 遇 到 例如 振 铃 、 串 扰 、 反 射 和 接地 反弹 这 些 问题 ， 从 而 严重 
地 影响 了 信和 号 的 完整 性 。 信 号 的 完整 性 变 差 就 会 导致 系统 的 可 笔 性 变 差 ， 造 成 系 
统 性 能 降低 ， 最 糟 的 情况 是 导致 系统 失效 。 好 消息 是 这 些 问题 可 以 通过 下 面 介绍 
的 良好 设计 技术 和 简单 的 布局 准则 来 解决 。 


6.4.1 信号 完整 性 问题 的 类 型 


信号 完整 性 问题 通常 有 四 种 类 型 ， 它 们 分 别 是 : 单个 线 网 的 信号 完整 性 ， 相 
邻 线 网 间 的 串扰 ， 轨 线 崩 演 和 电磁 干扰 (EMI) 。 
6.4.1.1 单个 线 网 的 信号 完整 性 

驱动 强度 是 源 / 漏 驱动 电流 大 小 的 指标 ， 压 摆 率 是 源 / 漏 电流 变化 快慢 的 指 
标 。 这 两 个 指标 共同 决定 了 输出 信号 的 上 升 和 下 降 时 间 。 工 艺 技术 的 尺寸 越 小 ， 
允许 时 钟 频 率 越 高 ， 而 时 钟 频率 越 高 意味 着 信号 的 上 升 和 下 降 时 间 越 短 。 由 于 制 
造 工 艺 技术 决定 了 信号 的 上 升 和 下 降 时 间 ， 这 就 意味 着 即使 是 低频 信号 ， 其 开关 
切换 时 间 也 缩短 了 。 信 号 的 开关 切换 时 间 变 短 ， 加 上 瞬时 电流 变 大 ， 这 就 造成 了 
更 大 的 开关 噪声 。 对 高 频 链 路 信和 号 而 言 ， 或 许 有 必要 缩短 信号 的 上 升 和 下 降 时 
间 。 然 而 对 于 低频 链 路 信号 ， 设 计 师 可 能 要 通过 延长 信号 的 上 升 和 下 降 时 间 来 降 
低 噪声 。 
6.4.1.2 串扰 

当 信 号 沿 导线 传输 时 ， 就 会 在 导线 周围 形成 一 个 磁场 。 如 果 两 个 导线 彼此 相 
邻 ， 这 两 个 磁场 有 可 能 相互 作用 ， 从 而 导致 两 个 信号 能 量 的 交叉 耦合 ， 这 种 现象 
称 为 串扰 。 
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以 下 五 种 PCB 设计 技术 能 显著 地 降低 串扰 : 

1. 在 布线 约束 允许 的 情况 下 ， 信 号 的 线 间 距 应 尽量 地 放宽 。 

2. 设计 传输 线 时 ， 应 该 将 传输 线 尽 可 能 地 安排 在 与 地 线 层 相 邻 的 层 。 传 输 
线 和 地 线 层 的 紧密 耦合 能 有 效 地 解除 传输 线 和 相 邻 信号 间 的 耦合 。 

3. 尽 可 能 地 使 用 差分 布线 技术 ， 特 别 是 对 那些 关键 的 线 网 。 

4. 若 信号 间 有 明显 的 耦合 ， 则 令 这 些 信 号 分 布 在 不 同 的 层 并 彼此 正 交 。 

5. 使 得 信号 之 间 并 行 布线 的 长 度 尽 可 能 地 短 。 使 用 短 并 行 线路 布线 ， 尽 可 
能 地 将 长 耦合 的 线路 最 短 化 。 
6.4.1.3 轨 线 的 骨 溃 (Rail Collapse) 

轨 线 骨 泪 是 指 分 布 在 电路 板 上 为 芯片 供电 的 电源 和 地 线 网 络 所 产生 的 噪声 。 
输入 /输出 〈LO) 的 开关 切换 会 在 电源 和 地 线 之 间 的 阻抗 上 产生 一 个 电压 降 。 
在 实际 电路 中 ， 这 个 电压 降 有 可 能 造成 FPGA 器 件 供 电 电 压 的 显著 降低 ， 从 而 使 
轨 线 问题 进一步 恶化 。 

解决 轨 线 问题 的 方法 是 设计 更 合理 的 电源 和 地 线 分 布 网 络 ， 尽 可 能 地 减 小 电 
源 分 布 系统 的 阻抗 。 


6.4.2 电磁 干扰 


电磁 传导 或 者 辐射 会 影响 电路 的 正常 运行 ， 造 成 的 干扰 就 是 电磁 干扰 〈 工 - 
lectro Magnetic Interference，EMI) 。 这 种 干扰 可 能 中 断 、 阻 止 、 降 低 或 限制 电路 
的 有 效 性 。EMI 源 自 电流 的 迅速 变化 。 

FPGA 成 为 EMI 源 的 现象 是 很 罕见 的 。 但 随 着 散热 器 、 电 路 板 和 电缆 使 用 的 
增加 ，FPGA 产生 EMI 的 可 能 性 也 增加 了 。 

通过 以 下 措施 能 降低 FPCA 产生 EMI 的 可 能 性 : 

1. 尽 可 能 地 在 接近 FPGA 的 位 置 ， 用 旁 路 或 者 “ 退 偶 ”电容 跨 接 电源 的 两 
极 ; 

2. 使 用 串联 电阻 控制 高 速 信号 的 上 升 时 间 ; 

3. VCC 滤波 ; 

4. 屏蔽 。 屏 项 元 器 件 会 增加 额外 的 费用 ， 因 此 通常 作为 不 得 已 的 最 后 措施 。 

电路 板 EMI 的 两 种 最 常见 来 源 是 : 

1. 差分 信号 到 共 模 信号 的 转换 过 程 中 所 产生 的 共 模 信号 会 泄漏 ， 并 共 加 到 
外 部 双 绞 线 上 。 

2. 电路 板 上 的 地 线 反 弹 会 在 外 部 单 端 屏 蔽 电缆 上 产生 共 模 电流 。 

将 高 速 信号 编组 ， 把 它们 的 布线 安排 在 电路 板 上 不 至 于 产生 过 多 电磁 干扰 的 
合适 地 方 ， 以 控制 EMI 效应 。 

对 高 速 产品 进行 高 效 设 计 的 关键 是 充分 利用 分 析 工 具 的 优势 ， 进 行 准 确 的 性 
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能 了 预测。 测量 EMI 的 大 小 则 是 验证 设计 过 程 、 降 低 风险 以 及 增加 对 设计 工具 信 


心 的 一 种 手段 。 


6.5 FPGA 引 脚 分 配 的 设计 流程 


这 里 为 在 电路 板 设计 中 顺利 分 配 FPCA 引 脚 推荐 两 个 设计 流程 。 这 两 个 设计 
流程 都 能 为 FPCA 设计 师 和 电路 板 设计 师 间 的 交流 提供 充分 的 沟通 机 制 。 


6.5.1 


流程 1: 由 FPGA 设计 师 主动 


在 这 个 设计 流程 中 ， 最 初 的 FPCA 引 脚 分 配方 案 是 由 FPGA 工程 师 制定 的 ， 
他 将 FPCA 引 脚 分 配 的 细节 提供 给 PCB 设计 工程 师 。 为 方便 电路 板 设计 ， 电 路 
板 设 计 工 程 师 若 想 改动 引 脚 的 分 布 ， 就 要 将 这 些 改动 的 细节 提供 给 FPGA 设计 
师 。 之 后 ，FPGA 设计 师 再 用 FPGA 设计 软件 对 引 脚 的 分 配 做 修改 ， 并 确认 这 些 
改动 不 会 影响 FPCA 设计 的 正常 运行 。 这 个 过 程 一 直 持续 下 去 ， 直 到 得 到 最 终 的 


引 脚 分 配方 案 ， 


既 能 满足 FPGA 设计 师 的 需求 ， 也 能 达到 PCB 设计 师 的 要 求 。 


在 实际 工作 中 ， 如 果 最 初 的 引 脚 分 配方 案 是 由 FPGA 设计 师 提出 的 ， 那么 他 


首先 需要 了 解 电路 板 的 布局 ， 辟 如 与 
FPGA 接口 的 电路 板 器 件 (如 存储 器 ， 
收发 器 ， 微 处 理 器 等 ) 有 几 个 ， 它 们 
的 位 置 在 哪里 。 然 后 ， 他 才能 根据 实 
际 情况 进行 引 脚 分 配 。 壁 如 ， 先 将 存 
储 器 接口 分 配给 某 个 LO 区 ， 接 着 让 
FPGA 设计 软件 自动 地 进行 引 脚 分 配 。 
这 种 方法 可 以 大 大 加 快 引 脚 的 分 配 过 
程 。 这 是 因为 PCB 设计 师 为 了 减少 电 
路 板 上 的 线路 交叉 等 事项 ， 只 需要 与 
FPGA 设计 师 ， 就 少量 引 脚 的 交换 做 一 
些 简单 的 沟通 即 可 ， 不 需要 大 规模 地 
修改 引 脚 的 分 配方 案 〈 见 图 6-3 ) 。 
步骤 1: 第 一 步 是 在 FPGA 设计 软 
件 中 进行 的 。FPGA 设计 师 首 先 选取 一 
款 型 号 和 封装 合适 的 FPGA 器 件 ， 在 
这 个 目标 器 件 上 创建 一 个 FPCA 设计 
项 目 。 为 适应 未 来 设计 的 扩展 或 缩减 ， 
建议 设计 者 在 这 个 阶段 把 FPGA 设计 


步骤 1: 创建 项 目 并 选择 器 件 


迭代 进行 
引 脚 改动 


C2 


到 6-3 ”由 FPGA 设计 师 主动 的 
FPGA 引 脚 分 配 流程 图 
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软件 中 允许 移植 到 所 有 器 件 上 的 功能 选项 启动 。 

步 又 2: 根据 FPGA 设计 ，FPGA 设计 师 开 始 输入 引 脚 信息 。 在 FPGA 设计 
周期 中 的 这 个 阶段 ，FPGA 设计 未 必 完 整 ， 但 接口 却 必须 先 确定 下 来 。 至 少 顶 层 
设计 文件 应 当 存 在 。 这 个 文件 为 设计 师 提供 充足 的 信息 ， 以 输入 引 脚 名 称 ， 输 入 
诸如 IO 标准 、 电 流 强 度 等 引 脚 属性 。 这 些 信息 可 手动 输入 到 FPGA 设计 软件 
中 ， 在 大 多 数 情况 下 也 可 从 其 他 资源 中 导入 ,例如 Microsoft Excel。 建 议 在 设计 
说 明 书 中 定义 这 些 信 息 并 使 其 具有 . csv 格式 ， 以 方便 导入 FPGA 设计 软件 。 这 
将 大 大 缩短 引 脚 信息 的 输入 过 程 ， 并 降低 人 为 错误 的 风险 。 

如 果 正 在 使 用 接口 P， 其 中 一 些 IP 可 能 已 经 含有 引 脚 属性 信息 。 那 么 在 设 
计 中 应 当 添 加 这 些 IP 的 源 文件 。FPGA 设计 软件 通常 能 从 IP 源 文件 中 读 取 引 脚 
的 属性 。 

步骤 3: 通过 配置 每 个 被 使 用 卫 的 端口 和 参数 来 定义 设计 接口 ， 使 IP 的 站 
口 与 顶层 HDL 文件 的 接口 连接 。 正 如 前 面 提 到 的 那样 ,建议 顶 层 设计 文件 早已 
确定 。 然 而 在 设计 说 明 书 已 经 完成 ， 但 设计 文件 并 不 存在 的 情况 下 ， 有 些 FPGA 
设计 软件 也 可 以 根据 输入 FPCA 设计 软件 的 引 脚 信息 ， 自 动 地 生成 顶层 HDL 包 
装 文 件 。 在 FPCA 设计 软件 中 ， 需 要 启动 对 顶层 设计 文件 的 VO 规则 检查 。 设 计 
师 通 过 编写 设计 接口 ， 实 际 上 就 为 FPGCA 设计 生成 了 顶层 模块 的 接口 方 框图 。 给 
FPGA 设计 软件 提供 的 设计 信息 越 多 ，FPGA 设计 软件 可 执行 的 V0 规则 检查 就 
越 完整 。 

步骤 4: 进行 引 脚 分 配 。 如 果 分 配给 某 WO 信号 引 脚 的 确切 位 置 是 已 知 的 ， 
就 直接 将 已 知 的 信息 输入 到 FPGA 设计 软件 中 。 对 于 IP 来 说 ,这些 信 息 通 常 是 
被 导入 的 。 如 果 只 知道 信号 引 脚 的 大 臻 范围， 那么 分 配给 该 信号 的 引 肢 位置 可 以 
不 必 十 分 具体 ， 只 要 指定 一 个 范围 即 可 ,例如 把 某 信 号 分 配 到 IO 区 域 1， 随 
后 ， 让 FPGA 设计 软件 自动 地 选择 引 脚 的 具体 位 置 。 

步骤 5: 进行 输入 /输出 (IY0) 规则 检查 ， 产 生 合理 有 效 的 引 脚 分 配 。 所 有 
FPCA 设计 软件 都 有 0 规则 检查 功能 。 这 一 功能 可 用 来 检查 VO 信号 引 脚 分 配 
的 合理 性 和 有 效 性 。 有 些 FPGA 软件 设计 包 能 根据 器 件 引 脚 的 分 区 自动 为 0 信 
号 分 配合 适 的 引 脚 ， 而 不 必 逐 一 指定 具体 的 引 脚 。 自 动 分 配 产生 的 引 脚 列表 可 以 
在 被 用 户 接受 后 ， 传 递 给 电路 板 设计 师 ， 用 作 与 电路 板 连接 的 引 脚 分 配 表 。 

在 设计 尚未 完成 的 情况 下 ， 用 设计 软件 对 FPGA 引 脚 分 配 做 YO 规则 检查 
时 ， 可 选 的 检查 项 十 分 有 限 。 因 此 ， 强 烈 建议 设计 师 先 编写 一 个 虚拟 设计 ， 其 中 
包含 接口 所 使 用 的 每 个 IP 和 时 钟 网 络 的 细节 。 这 些 接 口 能 与 虚拟 逻辑 连接 ， 壁 
如 ，FIFO 就 是 这 样 一 个 接口 ， 与 FIFO 连接 的 内 部 模块 尚未 完工 ， 可 用 虚拟 模块 
代替 。 借 助 于 这 种 方法 ，FPGA 设计 软件 可 以 对 设计 中 将 用 到 的 所 有 LIZO 规则 做 
全 面 的 检查 ， 从 而 确保 在 以 后 的 设计 中 添加 内 部 逻辑 块 后， 仍然 能 使 用 相同 的 引 
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脚 分 配 。 

重复 执行 步骤 4 和 步骤 5， 直 到 FPGA 和 电路 板 都 可 用 的 FPGA 引 脚 分 配方 
案 瓜 熟 带 落 。 

随 着 设计 的 逐渐 完善 ， 任 何 潜在 的 引 脚 分 配 问题 都 应 及 时 与 电路 板 设计 师 沟 
通 。 可 以 在 电路 板 层 面 ， 也 可 以 在 FPGA 设计 层面 上 做 修改 来 解决 这 些 问 题 。 但 
不 需要 对 虚拟 设计 做 任何 改动 ， 因 为 虚拟 设计 只 是 用 于 表示 最 终 设计 将 如 何 分 配 
FPGA 的 引 脚 。 


6.5.2 流程 2: 由 电路 板 设 计 师 主动 


在 这 个 设计 流程 中 ， 由 PCB 设计 师 用 电路 板 设 计 软 件 生成 最 初 的 FPGA 引 
脚 分 配方 案 ， 并 把 其 细节 提供 给 FPCA 设计 师 。 电 路 板 设 计 师 也 可 运行 FPGA 设 
计 软 件 来 输入 引 脚 的 详细 信 
息 。 但 这 种 情况 在 现实 中 很 少 
见 ， 除 非 FPGA 和 电路 板 都 由 
同一 工程 师 负 责 设计 。 在 大 多 
数 情况 下 ， 由 FPGA 设计 师 用 
FPGA 设计 软件 进行 引 肢 分 配 ， 
并 确认 该 引 脚 分 配方 案 能 满足 
FPGA 设计 的 需求 。 若 引 脚 分 
配 存在 问题 ， 则 FPGA 设计 师 
应 先 用 FPGA 设计 软件 进行 修 
改 ， 引 脚 分 配 正 确 之 后 ， 再 将 
引 脚 变动 的 信息 传送 给 电路 板 
设计 师 。 这 个 过 程 一 直 持 续 下 
去 ， 直 到 获得 一 个 既 能 满足 
FPCA 设计 师 又 能 满足 电路 板 
设计 师 需 求 的 最 终 引 脚 分 配方 友 64 ”由 电路 板 设计 师 主动 的 
案 ( 见 图 6-4)。 FPGA 引 脚 分 配 流程 图 

步骤 1: 根据 电路 板 上 将 
与 FPGA 接口 的 元 件 ， 由 电路 板 设计 师 ， 编 写 FPCA 的 引 脚 分 配方 案 。 这 需要 关 
于 FPGA 器 件 驱 动能 力 和 时 钟 限 制 的 详细 信息 。 在 实际 工作 中 ， 为 了 走 好 这 一 
步 ， 电 路 板 设计 师 需要 与 FPGA 设计 师 密切 配合 ， 咨 询 收发 器 在 FPGA 器 件 上 的 
具体 位 置 ， 电 源 轨 线 的 具体 要 求 ， 以 及 与 引 脚 输出 限制 有 关 的 其 他 问题 。 然 后 ， 
由 电路 板 设计 师 编 写 第 一 版 引 脚 分 配方 案 ， 并 将 引 脚 分 配 信息 传 给 FPCA 设计 
师 。 


步骤 1; 在 电路 板 设 计 软 件 中 
创建 引 脚 输出 


步骤 2: 创建 FPGA 项 目 & 选 择 器 件 


, 迭代 引 
步骤 3: 添加 引 脚 属性 脚 改动 


步骤 4: 进行 引 脚 分 配 


步骤 5: 执行 IO 规则 检查 
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步 又 2，3，4: 和 流程 1 中 的 步骤 1，2 和 4 相同 。FPGA 设计 师 将 用 FPCA 
设计 软件 创建 FPGA 项 目 ， 进 行 引 脚 分 配 ， 并 配置 引 脚 属性 。 

步骤 5: 由 FPGA 设计 师 运 行 YO 规则 检查 器 以 确认 引 脚 的 分 配 ， 提 出 改进 
的 建议 ， 并 与 电路 板 设 计 师 沟通 。 这 个 过 程 一 直 持 续 下 去 ， 直 到 获得 到 一 个 满意 
的 引 脚 分 配 为 止 。 像 流程 1 一 样 ，FPGA 设计 师 应 当 创建 一 个 虚拟 设计 或 使 用 真 
实 的 设计 以 确保 该 引 脚 分 配方 案 能 正常 运行 。 


6. 5.3 ”FPGA 设计 师 和 电路 板 设 计 师 如 何 进行 引 脚 改动 的 沟通 


通过 口头 或 者 电子 邮件 就 引 脚 分 配方 案 的 变动 进行 沟通 是 一 种 趋势 。 然 而 ， 
这 种 沟通 方式 很 容易 出 错 。 需 要 用 一 个 有 版 本 控制 的 正式 文件 ， 在 FPGA 设计 师 
和 电路 板 设 计 师 之 间 ， 作 为 传递 引 脚 变动 信息 的 媒介 。 在 本 章 前 面 曾 提 到 ， 许 多 
公司 中 和 常用 Microsoft Excel 来 满足 这 个 需求 。 使 用 Microsoft Excel 的 一 个 优势 是 
很 多 电路 板 设计 工具 和 一 些 FPGA 设计 软件 都 能 导入 或 导出 . csv 文件 。 


6.6 电路 板 设 计 的 审查 要 点 


为 了 保证 FPGA 引 脚 分 配 获 得 成 功 ， 电 路 板 设计 审查 要 点 总 结 如 下 : 

1. 对 电路 板 设计 进行 电源 热 分 析 ， 以 确保 所 有 电源 层 在 提供 所 需 最 大 电流 
时 ， 仍 能 保证 电压 轨 线 符合 规范 。 

2. 进行 引 脚 分 配 检查 。 

a. 用 FPGA 设计 软件 检查 引 脚 的 分 配 ; 

b. 将 所 有 未 使 用 的 输入 端 接地 ; 

c. 根据 需要 将 所 有 未 使 用 的 输入 /输出 (lA0) 接地 、 接 Vec 或 挂 起 ; 

d. 检查 每 个 IO 区 VCCIO 的 正确 性 ; 

e. 设计 是 否 符 合 SSN 准则 ? 

f 选择 可 移植 的 器 件 以 适应 未 来 设计 规模 的 扩大 或 缩减 。 

3. 对 照 厂商 提供 的 配置 手册 ， 进 行 配 置 模 式 检查 。 

4. 对 照 厂商 推荐 的 电源 设计 标准 ， 检 查 电源 的 连接 和 去 耦 。 

5. 进行 电路 板 信 号 完整 性 仿真 。 

6. 将 IO 时 序 和 IO 时 序 需 求 进行 对 比 。 在 进行 对 比 时 ， 要 求 整个 设计 已 
接近 完成 或 至 少 设计 的 10 接口 部 分 已 经 完成 。 

7. 将 电路 板 设计 递交 给 FPGA 设计 小 组 和 PCB 设计 小 组 ， 共 同 完成 对 电路 
板 设计 的 全 面 审 查 。 
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7.1 引言 


FPCA 器 件 规模 的 增长 和 性 能 的 提升 导致 FPCA 器 件 功 耗 变 大 。FPCA 设计 
工程 师 和 PCB 设计 工程 师 在 选择 使 用 FPCA 器 件 和 特定 的 FPCA 供应 商 时 ， 都 需 
要 考虑 功 耗 问题 。 因 为 FPGA 器件 的 功 耗 将 影响 PCB 的 电源 设计 ， 以 及 对 稳 压 
器 、 吸 热 设 备 和 系统 冷却 系统 的 选择 。 简 而 言 之 ， 对 整个 系统 做 功 耗 预 算 至 关 重 
要 。 

对 功 耗 敏 感 和 功 耗 预算 较 紧 的 应 用 而 言 ， 在 设计 开发 的 过 程 中 ， 设 计 工程 师 
需要 进行 功 耗 分 析 ， 并 采用 适当 的 低 功 耗 技术 。 在 整个 设计 周期 中 ， 工 程 师 应 具 
有 细 化 预 佑 功 耗 的 能 力 ， 并 采用 恰当 的 功 耗 管理 设计 技术 。 

如 今 的 FPCA 器 件 拥 有 多 种 特性 来 降低 FPCA 融 件 的 功 耗 ， 包 括 FPCA 设计 
软件 中 的 功 耗 优 化 选项 。 本 书 中 关于 RTL 编码 指南 和 时 序 收敛 的 章节 将 涉及 功 
耗 优化 技术 的 细节 。 

FPGA 厂商 也 在 设计 流程 的 不 同 阶 段 提供 了 FPGA 功 耗 估计 的 解决 方法 。 

本 章 将 首先 考察 影响 FPGA 器 件 功 耗 的 几 个 基本 要 素 ， 以 及 影响 设计 者 获得 
设计 功 耗 准确 佑 计 能 力 的 主要 因素 ; 接着 ， 关 注 在 设计 最 初 阶段 进行 功 耗 佑 计时 
所 使 用 的 工具 和 软件 ， 设 计 最 初 阶段 进行 功 耗 估计 是 为 了 正确 地 选择 FPCA 的 设 
计 技 术 ， 以 及 为 电路 板 设计 选择 恰当 的 电源 稳 压 器 和 元 器 件 ; 然后 考察 可 对 设计 
实现 进行 更 加 精细 功 耗 估计 的 工具 和 技术 。 最 后 ， 对 于 FPCA 设计 中 的 不 同 阶段 
处 理 功 耗 问题 的 具体 方法 进行 总 结 ， 以 表格 的 形式 提出 了 最 佳 的 建议 。 


7.2 功 耗 的 基本 要 素 


热 功 耗 〈Thermal power) 是 总 功 耗 中 耗 散 在 器 件 封 装 上 的 那 一 部 分 功 耗 。 为 
保证 管 必 结 区 内 部 温度 维持 在 推荐 的 范围 内 ， 在 决定 是 否 应 该 对 FPGA 采用 散热 
措施 〈 如 散热 设备 ) 时 ， 需 要 考虑 热 功 耗 。 

当 考 虑 FPCA 器 件 的 输出 负载 和 外 部 的 终端 连接 时 ，FPCA 器 件 的 总 功 耗 由 
以 下 五 个 主要 的 部 分 构成 。 
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7.2.1 静态 功 耗 


所 谓 的 静态 就 是 设计 中 没有 活动 和 翻转 时 的 状态 。 当 设计 处 于 静态 时 由 漏 
电流 引起 的 功 耗 称 为 静态 功 耗 。 这 种 类 型 的 功 耗 通常 被 称 为 待机 功 耗 ， 它 与 具 
体 的 设计 无 关 。 漏 电流 的 大 小 取决 于 管 芯 的 太 十 、 结 区 的 温度 和 工艺 的 变化 。 
这 些 资料 可 以 从 FPCA 器 件 的 数据 手册 或 者 从 广 商 提供 的 早期 功 耗 估 计 试 算 表 
中 提取 。 这 里 推荐 后 者 ， 因 为 后 者 的 数据 格式 通常 比 大 多 数 数据 手册 清晰 得 
多 。 


7.2.2 动态 功 耗 


由 于 FPGA 内 部 节点 翻转 引起 器 件 操 作 所 消耗 的 功 耗 称 为 动态 功 耗 。 也 就 
是 ， 逻 辑 阵列 中 负载 电容 的 充 放电 和 信号 路 由 引起 的 功 耗 。 影 响 动态 功 耗 的 主要 
变量 是 充电 电容 ， 供 电 电 压 和 时 钟 频率 。FPCA 器 件 的 总 动态 功 耗 中 很 大 部 分 源 
于 它 的 布线 结构 。 
动态 功 耗 取决 设计 ，RTL 代码 的 编写 风格 对 动态 功 耗 有 很 大 的 影响 。 


7.2.3 输入 /输出 功 耗 


连接 到 器 件 输出 引 脚 的 外 部 负载 电容 的 充 放电 和 所 有 端 接 网 络 消耗 的 功率 就 
是 输入 /输出 〈 即 IO) 功 耗 。 同 样 ，LO 功 耗 取决 于 设计 ， 并 受到 LO 标准 、 
数据 速率 、 引 脚 配置 情况 〈 输 入 ， 输 出 ， 双 向 ) 的 影响 。 输 入 的 端 接 和 输出 的 
电流 强度 、 压 摆 率 和 负载 都 会 影响 IO 功 耗 。 
7.2.4 浪 涌 电流 

浪 涌 电流 是 器 件 在 初始 上 电 时 需要 的 电流 ， 因 而 会 产生 功 耗 。 在 上 电 阶 段 的 
一 段 特 定 的 持续 时 间 内 ， 必 须 提供 给 器 件 最 小 的 逻辑 阵列 电流 (ICCINT) 。 这 上段 
持续 时 间 的 长 短 取决 于 可 以 从 电源 获得 的 电流 的 大 小 。 当 电压 达到 额定 电压 的 
90% 时 ， 通 常 就 不 再 需要 这 个 初始 的 强 电流 了 。 随 着 器 件 温度 的 升 高 ， 上 电 时 需 
要 的 浪 涌 电 流 会 减 小 ， 然 而 街机 电流 会 变 大 。 
7.2.5 配置 功 耗 

在 配置 器 件 时 需要 的 功 耗 就 是 配置 功 耗 。 在 配置 和 初始 化 阶段 ， 器 件 需 
要 功 耗 来 复位 寄存 器 、 使 能 IO 引 脚 、 输 入 操作 模式 。 在 器 件 上 电 阶段 ， 配 
置 器 件 之 前 和 期 间 ，LZO 引 脚 通常 处 于 三 态 以 减少 功 耗 并 防止 它们 在 此 期 间 
失控 。 


第 7 章 ” 功 耗 和 热 分 析 37 . 


7.3 准确 估计 功 耗 的 关键 因素 


在 讨论 对 FPCA 设计 进行 功 耗 和 热 分 析 的 最 佳 方法 之 前 ， 我 们 先 来 关注 影响 
准确 估计 功 耗 的 几 个 关键 因素 〈 见 图 7-1) 。 


操作 条 件 和 
器 件 特性 


电路 的 功 耗 模型 


图 7-1 准确 估计 功 耗 的 关键 因素 
7.3.1 FPGA 电路 的 准确 功 耗 模型 


功 耗 估 计 模 型 是 FPCA 三 商 提供 的 功 耗 估计 解决 方案 中 的 一 部 分 。FPCA 设 
计 者 必须 相信 FPGA 厂商 提供 的 模型 是 可 靠 的 。 这 些 模 型 通常 基于 HSPICE 开发 
并 和 芯片 的 特性 相关 。 不 同 FPCA 三 商 的 开发 过 程 略 有 不 同 。 功 耗 模型 的 准确 度 
随 FPGA 器 件 系列 的 不 断 成 熟 而 变化 。 新 上 市 的 FPCA 器 件 系列 提供 的 是 初步 的 
功 耗 模型 ， 功 耗 模型 会 随 FPGA 厂商 对 这 个 器 件 系 列 特性 的 完善 而 改变 。 若 FP- 
GA 厂商 在 研发 初期 提供 的 HSPICE 模型 是 保守 的 ， 则 功 耗 模型 的 改变 带 来 的 负 
影响 就 非常 小 。 向 器 件 厂 商 咨 询 他 们 如 何 研发 功 耗 模型 的 细节 ， 有 助 于 对 功 耗 
模型 的 准确 度 建立 合理 的 期 望 。 


7.3.2 每 个 信号 的 准确 数据 切换 率 


数据 切换 率 也 被 称 作 信号 活动 性 ， 与 设计 的 性 能 相关 。 时 钟 速率 固然 重要 ， 
但 是 单位 时 间 内 信和 号 变化 的 平均 次 数 更 加 重要 ， 因 为 这 个 切换 过 程 会 影响 功 耗 。 

逻辑 “1” 消 耗 的 功率 超过 逻辑 “0” 消 耗 的 功率 ， 因 而 信号 维持 逻辑 “17” 
时 间 的 长 短 将 影响 功 耗 。 这 就 对 使 用 端 接 标 准 的 输入 /输出 功 耗 有 影响 。 

由 于 数据 切换 率 取决 于 系统 的 运行 ， 因 而 它 完 全 在 FPCA 设计 工程 师 的 掌控 
之 中 。 数 据 切换 率 信息 通常 从 设计 仿真 中 抽取 或 者 根据 以 往 的 设计 经 验 。 因 此 对 
由 以 前 完成 的 工作 继承 而 来 的 设计 可 以 直接 输入 一 个 合理 的 数据 切换 率 ， 与 新 设 
计 比 较 是 件 较 容 易 的 事 。 但 也 不 能 过 分 强调 使 用 数据 切换 率 在 反映 最 终 系统 运行 


翻转 率 和 信号 发 生 
概率 (来 自 仿真 、 
用 户 输入 和 /或 非 
矢量 技术 ) 
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活跃 性 中 的 重要 性 ， 毕 竞 对 数据 切换 率 的 预测 不 太 准 确 是 功 耗 估计 误差 的 主要 来 

在 很 多 情况 下 ， 仿 真 数据 不 能 代表 实际 的 操作 。 如 执行 的 仿真 是 以 测量 代码 
覆盖 率 为 目的 ， 就 容易 造成 过 高 估计 实际 操作 中 的 功 耗 。 作 为 设计 者 应 当 避 免 由 
于 过 低 预 测 数据 切换 率 造成 的 危险 ， 因 为 这 样 将 导致 功 耗 的 低估 。 然 而 ， 过 高 预 
测 功 耗 可 能 导致 更 加 昂贵 的 功 耗 管理 方案 。 

除非 FPGA 设计 工程 师 设 定 ， 在 FPGA 厂商 提供 的 功 耗 估计 方案 中 ， 假 设 默 
认 的 数据 切换 率 为 12. 5% 。 对 于 大 多 数 应 用 而 言 ， 这 样 的 假设 在 设计 周期 的 起 
台阶 自已 经 足够 。 由 于 大 多 数 设计 中 并 不 是 在 所 有 的 节点 上 的 数据 都 有 很 高 的 切 
换 率 ， 所 以 在 最 终 的 应 用 场合 ， 规 定 将 总 功 耗 的 30% 以 内 作为 功 耗 估计 误差 的 
余 度 ， 应 该 能 满足 一 般 需求 。 然 而 ， 这 一 规定 并 不 适用 于 那些 设计 主体 进行 高 性 
能 处 理 的 情况 ， 例 如 许多 DSP 处 理 的 应 用 场合 。 这 些 设计 通常 呈现 出 较 高 的 数 
据 切换 率 。 

在 FPCA 厂商 提供 的 功 耗 估算 工具 中 修改 数据 切换 率 非 常 容易 ， 可 以 快速 地 
看 到 数据 切换 率 对 功 耗 的 影响 。 建 议 根据 不 同 的 应 用 场合 ， 设 计 者 应 尽量 准确 地 
估计 数据 切换 率 。 如 果 确 实 不 清楚 数据 切换 率 的 大 小 ， 建 议 试用 一 个 数据 切换 率 
的 范围 来 估算 可 能 的 最 好 和 最 差 的 功 耗 情况 。 注 意 : 完整 的 系统 设计 其 数据 切换 
率 不 可 能 高 于 40% 。 


7.3.3 准确 的 运行 条 件 


从 图 7-2 中 可 以 看 出 温度 对 待机 功 耗 的 影响 ， 当 结 温 高 于 85 时 功 耗 会 有 和 急 
剧 地 增加 ， 特 别 是 对 于 那些 65nm 工艺 尺寸 以 下 的 器 件 。 


85°C 
x 
散热 充分 散热 不 中 
耗 
65C 受 散 热 器 和 冷却 
系统 影响 的 曲线 
0 25°C 50°C 75°@ 100°C 125°C 
节 温 (CC) 
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静态 功 耗 受 温度 的 影响 很 大 ， 泄 漏 功 耗 是 结 温 的 指数 函数 。 当 泄漏 功 耗 增高 
时 ， 结 温 也 随 着 增高 ， 而 温度 增高 又 会 进一步 增 大 泄漏 功 耗 ， 形 成 了 正 反 馈 。 也 
= 也 +0。x( 符 机 功 耗 + 动态 功 耗 )，7, 代表 器 件 外 界 环境 温度 ，6, 是 右 件 连接 
点 和 周围 空气 的 热 阻 。 确 保 结 温 维持 在 其 操作 允许 的 温度 范围 内 ， 而 不 至 于 使 其 
进入 正 反 馈 至 关 重 要 。 器 件 消 耗 的 功 耗 越 大 ， 产 生 的 热量 就 越 多 ， 若 想 要 维持 正 
常 的 操作 温度 ， 则 必须 将 这 些 热量 散发 掉 。 

对 FPGA 设计 者 和 电路 板 设 计 者 来 说 ， 使 用 合适 的 热管 理 技术 来 降低 功 耗 非 
常 重要 。 


7.3.4 资源 利用 


FPCA 融 件 的 资源 利用 率 是 影响 功 耗 的 第 四 个 要 素 。 通 常 使 用 的 逻辑 单元 越 
多 功 耗 就 越 大 。 

当然 ， 作 为 设计 者 应 当知 道 FPGA 器 件 中 不 同类 型 的 资源 所 消耗 的 功 耗 有 所 
不 同 。 作 为 项 目 执行 者 应 当 有 能 力 选 用 合适 的 资源 以 减少 功 耗 ， 例 如 在 决定 究竟 
选用 逻辑 单元 还 是 专用 硬件 模块 (如 RAM 和 DSP 模块 ) 来 实现 相同 功能 时 ， 应 
做 适当 的 权衡 。 

典型 的 FPGA 设计 中 约 65% 的 功 耗 是 内 核 的 动态 功 耗 ， 约 24% 是 内 核 的 静 
态 功 耗 ， 约 10. 5% 是 输入 /输出 动态 功 耗 ， 约 0. 5 多 是 输入 /输出 静态 功 耗 。 

如 果 更 加 仔细 地 探究 内 核 的 动态 功 耗 ， 可 以 发 现 其 主要 部 分 源 于 逻辑 单元 中 
的 信号 路 由 和 组 合 逻 辑 。RAM 模块 也 消耗 可 观 的 动态 功 耗 。 

时 钟 网 络 的 动态 功 耗 包含 全 局 时 钟 的 布线 资源 加 上 分 布 在 LEs、RAM 和 DSP 
模块 中 的 本 地 时 钟 布线 资源 所 消耗 的 功率 。 设 计 者 可 以 通过 选择 资源 类 型 和 使 用 
时 钟 控 制 模块 来 控制 动态 功 耗 。 这 部 分 内 容 将 在 第 12 章 中 详 述 。 


7.4 ”设计 周期 早期 的 功 耗 估计 (电源 规划 ) 


如 前 面 所 述 ，FPGA 厂商 提供 的 数据 手册 中 关于 其 系列 器 件 典 型 功 耗 方面 的 
资料 不 太 全 面 。 然 而 ，FPGA 厂商 确实 为 它 的 某 些 器 件 提 供 了 可 产生 功 耗 报告 的 
功 耗 估计 工具 。 

对 FPGA 的 功 耗 提前 作出 估计 有 助 于 指导 电路 板 的 电源 设计 。 功 耗 估 计 通 常 
需要 在 FPCA 设计 完成 前 ， 其 至 设计 刚 开 始 时 就 着 手 执行 。FPGA 厂商 提供 的 功 
耗 估算 表 可 在 设计 周期 中 的 不 同 阶段 用 来 估算 用 户 设计 的 功 耗 ， 并 对 其 进行 初步 
的 热 分 析 。 

图 7-3 展示 了 一 个 功 耗 估算 示例 ， 通 过 人 机 对 话 填写 表格 , 便 可 自动 对 AL- 
tera Stratix IV GX 系列 进行 功 耗 估算 。 
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图 7-3 ”Altera Stratix IY GX 系列 功 耗 估算 表示 例 


FPGA 厂商 提供 基于 Excel 的 功 耗 估算 表 ， 用 户 可 从 该 厂商 的 官网 上 免费 下 
载 。 操 作 环境 和 最 终 设 计 的 相关 信息 提供 得 越 多 ， 功 耗 估计 就 会 越 准确 。 器 件 的 
成 熟 度 也 会 影响 功 耗 估计 的 准确 性 ， 例 如 厂商 提供 的 功 耗 模型 是 最 终 的 还 是 初步 
的 ， 功 耗 模型 不 同 ， 功 耗 估 计 的 准确 性 就 不 同 。 通 过 功 耗 估算 表 ， 花 最 少 的 功夫 
就 可 以 得 到 大 致 正确 的 功 耗 估计 ， 通常 可 以 将 误差 控制 在 实际 功 耗 的 30% 以 内 ; 
这 样 用 户 就 可 为 自己 的 项 目 选择 一 款 合 适 的 FPGA 器 件 ， 并 提前 确定 电源 的 规 
格 。 多 花 一 些 时 间 、 多 输入 一 些 关于 设计 和 操作 条 件 的 详细 信息 ， 通 常 能 获得 误 
差 在 实际 功 耗 20% 以 内 的 估计 。 设 计 者 可 在 这 些 工 具 中 输入 设计 和 操作 条 件 的 
详细 信息 。 一 些 FPGA 厂商 提供 的 工具 能 将 设计 编译 中 生成 的 数据 自动 导入 到 功 
耗 估 算 表 中 。 在 局 部 设计 的 功 耗 估 计 中 以 及 基于 传承 信息 的 功 耗 估 计 中 ， 这 个 功 
能 表现 得 十 分 良好 。 将 这 些 信息 作为 一 个 起 点 ， 而 将 诸如 不 同 资源 的 数量 ， 时 钟 
个 数 等 细节 在 功 耗 估算 表 中 进行 编辑 ， 以 反映 最 终 设计 预计 的 大 小 和 特性 。 正 如 
7.5 节 中 讨论 的 那样 ， 使 用 这 种 由 FPGA 厂商 提供 的 功 耗 估计 和 分 析 方 法 输入 设 
计数 据 ， 是 一 种 快 得 多 并 且 更 不 易 出 错 的 方法 。 
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7.5 ”基于 仿真 的 功 耗 估计 (设计 的 功 耗 验证 ) 


假如 仿真 向 量 代 表 了 实际 系统 的 运行 情况 ， 那 么 这 种 基于 仿真 的 功 耗 估计 方 
法 将 是 最 准确 的 功 耗 估计 解决 方案 。 基 于 仿真 的 功 耗 估计 利用 由 标准 EDA 工具 ， 
如 Mentor Modelsim ，Synopsys VCS 和 Cadence Incisive 等 产生 的 仿真 结果 来 模拟 
FPGA 髓 件 的 运行 。 可 把 仿真 得 到 结果 当 作 激励 ， 输 入 到 由 FPGA 厂商 提供 的 基 
于 仿真 的 功 耗 估计 工具 中 。 
将 数据 从 EDA 仿真 工具 转 到 FPGA 厂商 提供 的 软件 ， 通 常 使 用 向 量变 化 存 
储 (Vector Change Dump，VCD) 文件 。FPGA 三 商 提供 的 功 耗 估计 软件 中 的 功 
耗 估计 解决 方案 比 功 耗 估算 表 方 法 更 加 准确 ， 原 因 是 在 设计 的 布局 和 布线 都 全 部 
完成 之 后 ，FPGA 软件 的 功 耗 估计 模型 中 考虑 了 设计 中 实际 使 用 的 布局 布线 模 
型 。 此 外 ， 使 用 的 测试 向 量 与 真实 运行 情况 的 符合 程度 对 功 耗 估计 的 准确 度 也 有 
很 大 的 影响 。 

拥有 一 个 有 准确 仿真 向 量 的 设计 意味 着 设计 已 经 完成 或 者 马上 就 要 结束 。 因 
此 为 了 确定 设计 的 真实 功 耗 ， 建 议 大 部 分 设计 在 接近 设计 后 期 进行 此 类 分 析 。 相 
比 在 整个 设计 周期 中 不 断 地 检查 设计 是 否 在 功 耗 预算 之 内 ， 这 样 做 更 加 明智 。 

功 耗 临界 (敏感 ) 的 设计 是 一 个 例外 ， 由 功 耗 估计 得 到 的 数据 可 用 来 决定 
是 否 需 要 对 RTL 代码 进行 优化 以 降低 功 耗 ， 是 否 需 要 使 用 FPCA 厂商 所 提供 软 
件 中 的 功 耗 优化 选项 对 RTL 代码 进行 优化 以 降低 功 耗 。 在 设计 早期 对 已 有 的 
RTL 模块 可 运行 基于 功 耗 估 计 的 仿真 ， 以 期 得 到 这 些 模块 的 翻转 率 ， 翻 转 率 用 在 
功 耗 估算 表 中 对 已 有 的 RTL 模块 进行 功 耗 估计 。 可 重用 卫 模块 的 功 耗 报告 也 要 
纳入 模块 的 文档 中 ， 给 使 用 这 些 设计 模块 或 IP 的 其 他 用 户 提 供 有 关 模 块 期 望 功 
耗 的 背景 信息 。 

通过 仿真 可 以 得 到 设计 中 每 个 节点 的 数据 切换 率 ， 所 以 最 准确 的 功 耗 估计 可 
以 通过 门 级 仿真 得 到 。 然 而 ， 想 通过 门 级 仿真 得 到 最 准确 的 功 耗 估计 十 分 困难 。 
因为 对 于 如 视频 和 图 像 处 理 等 应 用 场合 而 言 ， 门 级 仿真 的 运行 时 间 特 别 宛 长 ， 尽 
管 这 种 分 析 方 法 可 得 到 最 准确 的 功 耗 估计 结果 ， 但 因为 仿真 时 间 太 长 ， 通 过 门 级 
仿真 来 估计 功 耗 并 不 实用 。 因 此 ， 对 这 类 应 用 场合 ， 我 们 建议 采用 RTL 级 仿真 。 
而 门 级 仿真 仅 用 于 个 别 的 运行 条 件 ， 对 设计 做 一 些 合 理性 检查 。 当 然 ， 对 最 终 的 
应 用 场合 而 言 ， 如 果 仿 真 时 间 的 长 度 能 被 接受 ， 建 议 使 用 门 级 仿真 。 

通过 RITL 仿真 ， 设 计 者 可 以 得 到 被 仿真 系统 中 输入 /输出 引 脚 和 大 多 数 寄存 
器 的 数据 翻转 率 ， 而 且 相 当 正确 。 而 综合 器 在 综合 优化 的 过 程 中 ， 会 进行 寄存 器 
的 复制 和 合并 ， 因 而 寄存 器 的 个 数 可 能 会 有 一 定 程度 的 误差 。 由 于 综合 过 程 中 执 
行 了 优化 操作 ， 造 成 节点 名 称 的 不 匹配 ， 使 得 组 合 节 点 的 个 数 也 不 十 分 准确 。 然 
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而 这 并 不 是 什么 大 问题 ， 因 为 大 多 数 基 于 仿真 的 功 耗 估 计 工 具 都 包含 一 个 称 为 无 
向 量 估计 的 模式 。 该 模式 与 基于 RIL 仿真 的 功 耗 估计 方法 结合 在 一 起 ， 可 以 为 
设计 者 提供 准确 度 可 接受 的 功 耗 估计 值 。 

无 向 量 功 耗 估 计 使 用 统计 分 析 的 方法 来 预测 节点 在 已 知 完好 的 数据 点 间 的 翻 
转 概 率 。 从 图 7-4 可 以 看 到 ， 如 果 知 道 输入 A，B，C，D,，E, F，G 和 日 的 静态 
概率 和 翻转 率 ， 就 有 可 能 估计 出 I，J，K,，L 的 静态 概率 和 翻转 率 ; 同 理 ， 也 可 
以 估计 出 最 终 输 出 M 的 静态 概率 和 翻转 率 。 


EE i 
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这 个 方法 可 以 用 来 提高 基于 RTL 仿真 的 功 耗 估计 方法 的 准确 度 。 为 了 达到 
最 佳 实际 效果 ， 建 议 运行 门 级 仿真 的 例子 ,但 是 对 于 仿真 时 间 很 长 的 系统 ， 建 议 
使 用 RTL + 无 向 量 估 计 的 方法 。 在 整个 设计 过 程 中 某 些 检查 点 上 ， 也 建议 使 用 基 
于 门 级 仿真 的 功 耗 估计 。 实 际 上 ,项 目 已 进展 到 这 一 阶段 ， 对 其 做 基于 门 级 仿真 
的 功 耗 估计 更 多 的 应 该 是 合理 性 验证 ， 而 非 必 不 可 少 。 在 进行 早期 的 功 耗 估计 之 
后 ,应当 在 功 耗 预算 上 留 足 够 的 余 量 ， 这 样 就 不 必 经 常 地 对 设计 进行 功 耗 优化 。 
在 早期 功 耗 估计 中 ， 设 计 者 需要 改变 温度 和 电压 等 操作 条 件 ， 以 确保 估计 得 到 的 
功 耗 值 确 实 能 反映 真实 环境 下 的 功 耗 。 

基于 仿真 的 功 耗 估计 工具 产生 的 功 耗 报告 ， 可 以 帮助 设计 者 确定 系统 在 散热 
和 电源 规划 方面 的 需求 。 这 些 报告 详细 地 指出 哪些 器 件 结构 ， 甚 至 哪个 层次 的 模 
块 的 热能 耗 最 大 ， 以 便于 做 出 降低 功 耗 的 正确 决定 。 在 数据 切换 率 相 当 准 确 的 前 
提 下 ， 这 种 功 耗 估计 方法 通常 能 得 到 误差 在 20% (器 件 测 量 值 ) 以 内 的 高 质量 
功 耗 估计 值 ( 见 图 7-5)。 
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图 7-$ Quartus IT PowerPlay Estimator 功 耗 估计 工具 的 报告 示例 
7.5.1 局 部 仿真 


基于 仿真 的 功 耗 估算 工具 所 面临 的 困难 之 一 ， 就 是 需要 剔除 测试 平台 中 的 
仿真 初始 化 时 间 。 如 果 测 试 平台 中 的 仿真 时 间 并 不 只 是 系统 长 时 间 的 持续 操 
作 ， 而 是 包括 了 仿真 初始 化 所 需要 的 时 间 ， 那 么 系统 有 效 的 数据 切换 率 就 会 降 
低 。 如 所 进行 的 仿真 并 没有 将 整个 仿真 时 间 都 用 于 信号 活动 性 的 计算 ， 就 会 降 
低 功 耗 估算 的 准确 度 。 例 如 ， 仿 真 时 间 为 10000 个 时 钟 周期 ， 前 2000 个 时 钟 
周期 都 用 在 芯片 的 复位 上 。 如 果 信 和 号 活动 性 计算 使 用 所 有 的 10000 个 时 钟 周 
期 ， 那 么 数据 切换 率 只 有 它们 稳 态 值 的 80% (因为 前 20% 的 仿真 时 间 用 在 艺 
片 复位 上 )。 一 些 FPGA 厂商 提供 的 功 耗 估计 工具 ， 人 允许 用 户 只 把 指定 的 VCD 
文件 中 的 有 用 部 分 用 于 功 耗 分 析 ， 这 就 可 以 把 仿真 初始 化 阶段 所 花费 的 那 部 分 
时 间 易 除 出 。 


7.6 功 耗 估计 的 最 佳 实 践 方法 


功 耗 佑 计 的 最 佳 实践 方法 见 图 7-6。 
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设计 周期 阶段 (Stage 
of Design Cycle) 


早期 功 耗 估计 阶段 
(Early Power 
Estimation) 


设计 开展 阶段 
(Evolving Desigm) 


最 终 设计 阶段 Final 
Design) 


任务 (Task) 


选择 器 件 (Device 


Selection) 


电路 板 供电 说 明 书 
(Board Power Supply 
Specification) 


电路 板 设 计 (Board 
Design) 


工具 (Tools) 


FPGA 广 高 功 耗 估算 表 
(FPGA Vendor Power 
Estimation 
Spreadsheet) 


FPGA 电 路 板 设计 指南 
(FPGA Vendor Board 
Design Guidelines) 


FPGA 厂 商 功 耗 估算 表 
(FPGA Vendor Power 
Estimation 

Spreadss heet) 


FPGA 电 路 板 设计 指南 
(FPGA Vendor Board 
Design Guidelines) 


基于 开展 设计 进行 功 耗 抽查 FPGA 厂 商 功 耗 估 算 表 


(Spot check Power 
Based Upon Evolving 
Design) 


功 耗 优化 后 估计 功 耗 
(Estimate Power for 
Power Optimization) 


确定 最 终 功 耗 
(Determine Final 
Power) 

功 耗 优化 后 估计 功 耗 
(Estimate Power for 
Power Optimization) 


电路 板 功 耗 测试 
(Measure Power on 
Board) 


| 


(FPGA Vendor Power 
Estimation 
Spreadsheet) 


FPGA 厂 商 提 供 的 基于 仿 
真 的 功 耗 估计 工具 
(FPGA Vendor 
Simulation Based Power 
Estimation Tool) 


FPGA 厂 商 提 供 的 基于 仿 
真 的 功 耗 估计 工具 (FEPGA 
Vendor Simulation 

Based Power) 


7-6 功 耗 估 计 的 最 佳 实践 方法 


附加 内 容 (Additional 
Conttnt) 


历史 设计 (Legacy 
Designs) 

以 往 经 验 (Previous 
Experience) 
设计 说 明 书 (Design 


Specification) 


早期 的 RTL 代 码 (Early 
RTL code) 


硬件 描述 语言 设计 (HDL 
Design) 


测试 平台 (Testbench) 
EDA 仿 真 工具 (EDA 


Simulation Tools) 


硬件 描述 语言 设计 
(HDL 设计 ) 


测试 平台 (Testbench) 


EDA 仿 真 工具 (EDA 
Simulation Tools) 和 
最 终 的 电路 板 和 测试 设 
备 (Final Board and 
Test) 


第 8 音 RTL 代码 设计 


无 论 是 为 FPCA 融 件 还 是 为 专用 集成 电路 〈ASIC) 编写 RTL 代码 时 ， 设 计 
师 都 不 能 不 回答 以 下 五 个 共同 的 高 层次 问题 : 

1. 设计 模块 想 要 达到 的 最 终 目标 究 竞 是 什么 ? 

2. 设计 模块 究竟 想 要 达到 最 高 性 能 ， 还 是 实现 最 小 面积 ? 

3. 模块 代码 的 功能 正确 吗 ? 是 和 否 能 很 容易 地 用 目标 器 件 的 综合 工具 进行 综 


4. RTL 模块 的 代码 能 不 能 重复 使 用 ? 

5. 设计 模块 能 否 很 容易 地 完成 布局 布线 ， 成 功 地 转变 为 组 件 模 型 ? 

然而 ， 在 为 FPGA 编写 RTL 代码 时 ， 还 需要 回答 男 外 两 个 FPGA 特有 的 高 层 
次 问题 : 

1，RTL 代码 是 否 已 针对 某 目标 类 型 的 FPGA 器件 结构 进行 过 优化 ?该 代码 
是 否 还 可 以 移植 到 其 他 结构 不 同 的 FPGA 上 ? 

2. RTL 代码 是 否 已 针对 编译 时 间 进 行 过 优化 ? 

当 更 深入 地 探究 如 何 为 FPCA 编写 RTL 代码 时 ， 我们 将 发 现 FPCA 的 RTL 
代码 与 ASIC 的 RTL 代码 相 比 较 ， 有 很 多 不 同 之 处 。 这 些 相 异 之 处 源 于 不 同 FP- 
GA 器 件 与 AISC 之 间 的 结构 差异 。 这 就 给 我 们 提出 了 在 编写 FPGA 器 件 的 RTL 
代码 时 的 第 一 条 准则 ， 即 “理解 目标 FPGA 器 件 的 结构 ”。 

本 章 为 具有 不 同 背景 的 设计 师 们 提供 了 快速 上 手 的 窍门 。 在 全 面 讲解 编写 
RTL 代码 常用 的 良好 习惯 之 前 ， 本 章 描述 了 一 些 常见 的 FPGA 器 件 结构 。 然 后 给 
出 针对 FPCA 器 件 结构 优化 的 RTL 编码 规范 ， 最 后 列 出 了 为 FPCAs 髓 件 编写 
RTL 代码 的 十 七 条 建议 作为 本 章 的 总 结 。 


8.2 常用 术语 


人 硬件 描述 语言 (Hardware Description Language，HDL) : 是 一 门 用 来 对 硬件 
进行 建 模 的 软件 编程 语言 。 
寄存 器 传输 级 (Register Transfer Level，RTL): 根据 信号 和 寄存 器 值 的 数据 
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流 操作 来 定义 输入 和 输出 之 间 的 关系 。 

行为 建 模 (Behavior Modeling) : 通过 输入 输出 关系 的 描述 来 建立 电路 模型 。 
行为 建 模 只 描述 电路 的 功能 ， 而 不 描述 最 后 实现 的 电路 结构 。 它 没有 在 某 种 硬件 
上 实现 的 明确 意图 ， 而 且 其 编码 风格 也 是 一 般 性 的 ， 以 致 于 它 能 够 以 任何 技术 为 
目标 ( 见 图 8-1)。 


输入 1,… ,输入 n if (input1) | 


for (j=0,j<8 ,j=j+2) 
#5 outputl =1'b0 ; 
else 


for (j=0,j<8,j=j+2) 
#5 outputl =1'b1 ; 


图 8-1 行为 建 模 


结构 建 模 (Structural Modeling) : 通过 描述 较 低层 次 的 元 件 和 原 语 的 互相 连 
接 关系 来 建立 电路 模型 。 结 构建 模 既 描述 电路 的 功能 也 描述 电路 的 结构 。 
它 由 设计 师 脑海 中 的 硬件 实现 的 想法 所 创建 〈 见 图 8-2 ) 。 


较 高 层次 
输入 1 输出 1 


-> 一 
低层 次 元 件 2 
低层 次 元 件 1 


图 8-2 ”结构 模型 


输入 n 输出 n 


综合 (Synthesis) : 把 HDL 代码 转换 成 电路 的 处 理 过 程 ， 转 换 之 后 还 要 对 电 
路 进行 优化 。 综 合 的 主要 任务 是 解释 设计 师 编 写 的 RTL 代码 ， 根 据 FPGA 目标 
带 件 的 结构 生成 相应 的 硬件 。 为 了 生成 正确 的 逻辑 ,综合 工 具 要 求 RIL 代码 有 
特定 的 编码 风格 。 编 码 风格 对 于 生成 高 速 有 效 的 逻辑 至 关 重 要 ( 见 图 8-3)。 
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always (@ (a or b or ¢ or d or sel) 


begin 
case(sel) 推断 
2'b00: mux_out = a; b 一 mux_out 
2'b01: mux_out = b; 
2'b10: mux_out=¢; 
2b1l1l1: mux_out= 4d,; 4 一 一 
endcase | 4 


end 


转换 


(目标 器 件 的 
结构 化 元 素 ) 


优化 


到 8-3 综合 


8.3 工程师 对 有 ASIC 设计 背景 的 建议 


对 具有 ASIC 设计 背景 的 工程 师 来 说 ， 首 先 需 要 知道 的 事情 是 FPCA 器 件 内 
部 布 满 了 寄存 器。 无 论 寄 存 器 是 否 被 使 用 ， 它 都 存在 于 已 购买 的 FPCA 器 件 中 。 
建议 设计 师 把 寄存 器 看 作 免 费 资源 ， 所 以 要 尽量 使 用 它们 ， 否 则 就 浪费 了 。 

寄存 器 的 使 用 对 FPGA 设计 的 性 能 而 言 非常 重要 。 在 相同 的 工艺 条 件 下 ， 
FPGA 的 逻辑 一 般 要 比 ASIC 的 逻辑 慢 。 为 了 满足 设计 性 能 的 要 求 ， 可 以 利用 寄 
存 器 使 设计 流水 化 。 

许多 ASIC 设计 中 使 用 锁 存 器 。 在 FPGA 设计 中 不 要 使 用 锁 存 器 ， 而 要 使 用 
寄存 器 来 代替 它 。 这 将 显著 地 提高 FPGA 的 时 序 性 能 ， 即 便 付出 潜在 的 延迟 代 
价 。 

在 ASIC 设计 中 ， 为 降低 功 耗 并 提高 可 测试 性 经 常 使 用 门 控 时 钟 技术 。 而 在 
FPGA 设计 中 ， 尽 量 不 要 使 用 门 控 时 钟 ， 而 要 使 用 “时 钟 使 能 ” 。 低 偏 斜 时 钟 网 
络 是 高 性 能 设计 运行 的 关键 ， 而 FPGA 器 件 内 这 样 的 时 钟 网 络 数量 有 限 。 使 用 门 
控 时 钟 会 用 完 低 偏 斜 全 局 时 钟 ， 从 而 限制 设计 的 性 能 。FPCA 器 件 的 所 有 寄存 器 
均 可 使 用 时 钟 使 能 信号 。 在 不 对 设计 性 能 造成 不 可 恢复 破坏 的 前 提 下 ， 时 钟 使 能 
言 号 可 用 来 降低 功 耗 ， 并 提高 设计 功能 的 可 测试 性 。 

不 能 将 FPGA 器 件 中 的 缓冲 器 当 作 可 靠 的 延迟 线 网 用 以 提高 设计 的 性 能 。 因 
此 ， 当 遇 到 设计 比较 临界 的 部 分 时 序 时 ， 最 好 保守 一 些 ， 在 时 序 需 求 方面 要 留 有 
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足够 的 余 量 。 

尽管 设计 师 可 以 为 FPCA 器 件 中 的 资源 买单 ， 但 是 只 要 确定 了 使 用 某 个 FP- 
GA 器 件 来 实现 设计 ， 那 么 可 用 的 资源 只 能 局 限于 目标 器 件 的 规模 ,不管 是 否 使 
用 都 得 花费 那么 多 钱 。 设 计 师 可 用 的 逻辑 单元 、 存 储 块 和 乘法 器 数量 都 将 受到 目 
标 霹 件 的 限制 。 此 外 ，FPCA 融 件 中 布线 资源 也 是 有 限 的 。 当 设计 达到 噩 件 利用 
率 的 上 界 时 ， 设 计 师 可 能 看 到 设计 的 性 能 开始 下 降 。 


8.4 推荐 的 FEFPGA 设计 规范 


8.4.1 同步 与 异步 


总 而 言 之 ， 在 设计 实践 中 必须 采用 同步 设计 方法 ， 因 为 它 将 自始至终 地 帮助 
你 达到 设计 目标 。 

而 异步 设计 技术 会 使 电路 的 行为 依赖 于 器 件 中 的 传输 延迟 ， 造 成 时 序 分 析 的 
不 完整 ， 产 生 冒 险 竞 争 。 

在 同步 设计 中 ， 只 用 一 个 时 钟 信 号 来 触发 所 有 的 事件 。 只 要 所 有 寄存 融 的 时 
序 要 求 都 能 够 得 到 满足 ， 那 么 ， 无 论 采 用 什么 工艺 、 电 压 和 温度 (PVT) 条 件 来 
实现 设计 ， 该 同步 设计 的 行为 都 是 可 预测 的 、 可 靠 的。 这 就 是 说 ， 采 用 同步 设计 
方法 完成 的 设计 可 以 很 容易 地 移植 到 系列 或 速度 等 级 各 不 相同 的 目标 器 件 上 实现 
其 功能 。 


8.4.2 全 局 信号 


FPGA 设计 软件 将 上 自动 地 选择 全 局 布线 资源 。 由 于 全 局 信号 资源 有 限 ， 应 当 
被 视 为 珍贵 资源 。 建 议 尽 可 能 地 限制 时 钟 域 的 数量 。 虽 然 设计 师 可 以 选择 由 自己 
来 控制 全 局 资源 的 使 用 ， 但 想 要 得 到 比 由 软件 自动 处 理 的 结果 更 好 一 些 ， 几 乎 不 
可 能 。 

设计 师 必 须 为 FPCA 设计 选择 一 个 同步 或 者 异步 的 复位 方案 。FPGA 设计 必 
须 有 一 个 可 将 整个 电路 置 于 确定 初始 状态 的 系统 复位 信号 。 设 计 师 应 该 在 仿真 开 
始 时 刻 ， 将 该 系统 复位 信号 输入 到 仿真 测试 平台 ， 用 以 验证 其 操作 的 正确 性 。 

如 果 不 能 确定 哪 一 种 复位 方案 对 系统 来 说 更 好 一 些 ， 就 使 用 同步 复位 ， 因 为 
它 更 容易 理解 。 

如 果 决 定 使 用 异步 复位 ， 那 么 该 异步 复位 应 该 由 如 图 84 所 示 的 同步 局 所 驱 
动 。 

为 什么 异步 复位 要 由 同步 器 来 驱动 呢 ? 

当 发 出 复位 信号 时 ， 没 有 确定 的 方法 知道 复位 信号 的 产生 与 时 钟 的 关系 。 一 
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些 寄 存 器 可 能 先 接收 到 时 钟 信 号 ， 另 一 些 寄存 器 却 先 接收 到 发 出 的 复位 信号 ， 这 
将 会 导致 混合 的 寄存 器 状态 。 如 果 这 是 一 个 短暂 的 复位 ， 它 也 许 就 被 完全 忽略 
如 图 84 所 示 同 步 器 的 电路 可 以 消除 所 有 上 述 问 题 。 
人 


rst_n, 到 系统 的 异步 


D D 
| 和 
六 清 零 端口 
aclr aclr 
rst 
clk > 
到 84 用 于 异步 复位 的 同步 器 


8.4.2.1 时 钟 网 络 资源 

器 件 范围 内 的 全 局 时 钟 布 线 资源 和 专用 时 钟 输入 都 由 FPCA 提供 。 只 要 FP- 
GA 器 件 中 还 有 低 偏锋 、 高 肩 出 的 专用 布线 资源 可 用 ,设计 师 就 应 该 使 用 。 

设计 师 应 该 把 设计 中 时 钟 的 个 数 限制 在 所 使 用 FPGA 器 件 中 可 用 的 专用 全 局 
时 钟 的 个 数 范围 内 。 若 不 使 用 全 局 布线 的 时 钟 ， 来 自 多 处 的 时 钟 信 号 有 可 能 造成 
器 件 内 部 时 钟 的 相位 偏差 ， 从 而 导致 时 序 问 题 。 

使 用 组 合 逻 辑 产 生 内 部 时 钟 会 增加 时 钟 线 上 的 延迟 。 在 某 些 场合 ， 这 种 时 钟 
线 上 的 延迟 会 导致 时 钟 的 偏锋 大 于 两 个 寄存 器 之 间 的 数据 路 径 延 运 。 如 果 时 钟 偏 
和 斜 大 于 数据 延迟 ， 那 么 这 个 设计 将 不 能 正确 地 运行 。 


8.4.3 专用 硬件 组 件 


所 有 的 FPCA 厂商 都 为 用 户 提供 广 商 自 定义 的 参数 化 组 件 库 ， 库 中 的 每 个 组 
件 都 能 高 效 地 完成 某 个 特定 功能 。 然 而 ， 只 要 在 RTL 代码 中 实例 引用 了 这 些 功 
能 组 件 ， 那 么 该 RTL 代码 就 被 锁定 在 某 一 个 FPCA 厂商 , 甚至 可 能 是 某 个 系列 的 
FPCA 器 件 上 。 这 显然 降低 了 设计 的 可 重用 性 。 实 例 引 用 了 这 些 功 能 组 件 后 也 可 
能 造成 RTL 仿真 速度 变 慢 。 行 为 描述 的 RAM 模型 可 能 比 FPGA 厂商 提供 的 参数 
化 RAM 模型 的 仿真 速度 快 得 多 。 这 是 由 于 FPGA 厂商 提供 的 模型 涵盖 了 所 有 可 
能 的 使 用 场合 ， 因 而 仿真 速度 可 能 更 慢 一 些 。 

在 某 些 应 用 场合 ， 设 计 师 除了 使 用 这 些 优化 的 参数 化 组 件 之 外 ， 并 没有 其 他 
更 好 的 选择 ， 因 为 这 些 组 件 是 使 用 该 器 件 某 些 特定 功能 的 唯一 途径 。 使 用 参数 化 
组 件 的 场合 有 很 多 ， 例 如 ， 构 建 时 钟 树 就 需要 使 用 锁 相 环 (PLL) 组 件 ， 构 建 高 
速 串 行 接口 就 需要 使 用 收发 絮 组 件 。 使 用 厂商 提供 的 组 件 是 构造 这 一 类 功能 模块 
的 通常 做 法 。 它 们 通常 能 够 被 其 他 系列 的 FPCA 器 件 或 其 他 厂商 的 等 效 技术 组 件 
所 替换 ， 对 设计 的 影响 极 小 。 这 非常 类 似 于 使 用 购买 的 IP 核 。 
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在 想 要 使 用 FPCA 片 内 组 件 ， 诸 如 片 内 RAM 块 和 DSP 组 件 ， 只 需要 实例 引 


用 这 一 类 组 件 即 可 。 知 想 要 自己 来 编写 这 一 类 组 件 ， 则 必须 掌握 比 RTL 级 别 更 
低层 次 的 语言 。 

这 些 由 FPCA 厂商 提供 的 功能 组 件 有 奉 干 个 待定 参数 需要 选择 或 设置 ,通常 
可 以 通过 窗口 菜单 和 对 话 框 ， 由 设计 师 参 考 说 明 书 作出 正确 的 选择 或 设置 。 
8. 4.3.1 实例 引用 的 模块 与 自己 编写 由 综合 生成 模块 之 间 的 比较 ( 见 图 8-5) 


| 实例 引用 
容易 使 用 , 有 图 形 界面 帮助 


全 硬件 特性 仿真 简单 
缺点 特定 的 结构 灵巧 仔细 的 手工 编写 
和 仿真 需要 库 文 件 依赖 计算 机 辅助 设计 工具 


图 8-5 实例 引用 的 模块 与 自己 编写 由 综合 生成 模块 之 间 的 比较 
8.4.4 低层 次 设计 原 语 的 使 用 


本 节 讨 论 由 厂商 提供 特定 的 低层 次 设计 模块 的 使 用 ,例如 使 用 进位 链 和 查找 
表 (LUT) 原 语 来 实现 设计 。 

自从 FPGA 发 明 以 来 ， FPGA 设计 师 就 一 直 使 用 这 种 设计 技术 。 在 艰难 和 于 
远 的 过 去 ， 使 用 低级 原 语 设计 是 保证 通过 综合 实现 设计 的 唯一 方法 。 多 年 来 
EDA 综合 工具 变 得 越 来 越 智能 ， 以 至 于 如 今 这 种 风格 的 设计 相对 于 常规 来 说 是 
特例 。 对 硬件 设计 而 言 ， 它 实际 上 类 似 于 软件 的 汇编 级 编程 或 者 用 原理 图 做 设 
计 ， 唯 一 稍 显 麻烦 的 是 必须 在 HDL 代码 中 声明 模块 的 连接 关系 。 

然而 为 什么 这 种 设计 风格 并 没有 完全 消失 ? 毕 竞 它 是 一 种 繁 元 的 设计 方法 ， 
而 现在 的 综合 工具 是 特别 智能 ， 使 用 这 些 低级 原 语 还 会 减少 设计 模块 可 重用 的 能 
力 。 

在 某 些 情况 下 ， 优 秀 的 设计 师 还 是 要 比 综合 器 聪明 一 些 。 让 我 以 加 法 器 设计 
为 例 来 说 明 这 个 问题 : 综合 器 通常 会 重新 构造 算术 结构 ， 一 有 机 会 就 简化 加 法 器 
进位 链 的 逻辑 。 这 个 简化 过 程 是 启发 式 的 ， 有 时 会 产生 次 优 的 分 组 。 如 果 设计 师 
考虑 目标 硬件 ， 并 依 此 构建 HDL 代码 ， 就 能 确保 获得 可 能 的 最 大 密度 。 使 用 低 
级 原 语 设计 意图 十 分 明确 ,方法 可 行 ， 并 与 周围 的 逻辑 无 关 。 然 而 ， 要 使 这 种 设 
计 方 法 发 挥 作用 ， 设 计 师 需要 对 加 法 器 按 位 分 片 ， 用 以 清楚 地 区 分 那些 是 想 要 的 
进位 输入 和 想 要 的 进位 输出 信号 。 
建议 尽量 避免 使 用 这 些 低级 原 语 ， 除 非 在 最 终 设计 中 性 能 或 者 面积 有 问题 。 
如 使 用 标准 RTL 编码 技术 的 设计 不 能 达到 设计 需要 的 性 能 ， 再 考虑 使 用 低级 原 
语 来 达到 设计 目标 。 设 计 师 可 以 建立 起 由 低级 原 语 构建 的 自 有 模块 库 ， 例 如 优化 
的 三 进 制 加 法 器 或 者 CRC (循环 元 余 校 验 ) 模块 。 然 而 必须 意识 到 的 是 这 些 模 


第 8 章 ”RTL 代码 设计 “ S1 . 


块 仅仅 能 在 这 个 FPGA 厂商 的 产品 中 可 重用 ， 甚 至 在 菜 些 情况 下 仅仅 能 在 特定 的 
FPCA 器 件 系 列 中 可 重用 。 


8. 4. 5 亚 稳 态 的 管理 


如 果 数据 在 输入 寄存 咒 时 违反 了 寄存 器 建立 时 间 和 /或 保持 时 间 的 要 求 ， 那 
么 寄存 器 的 输出 可 能 会 进入 亚 稳 态 。 在 这 种 状态 下 ， 寄 存 器 的 输出 值 会 在 高 电 平 
状态 和 低 电 平 状态 之 间 振 荡 。 如 果 这 个 振荡 的 值 在 整个 电路 中 传播 ， 其 他 的 寄存 
器 可 能 会 锁 存 这 个 错误 的 值 ， 从 而 引发 系统 错误 。 

当 数据 信号 在 时 钟 域 不 相关 的 两 套 电路 间 进 行 传输 的 时 候 ， 通 常会 发 生 亚 稳 
态 问 题 。 

为 了 避免 潜在 的 亚 稳 态 问题 ， 从 外 时 钟 域 输入 的 异步 信号 ， 在 输入 本 时 钟 域 
后 ， 先 通过 两 到 三 个 由 本 地 时 钟 触发 的 寄存 器 输出 后 再 使 用 是 一 个 好 习惯 〈 见 
图 8-6)。 


din 一 -| D D 
Q Q 盖 一 一 din_sync 


aclr > aclr 
clk | Ss 


到 8-6 ”两 个 寄存 器 组 成 的 同步 器 


8.5 编写 高 效 的 HDL 代码 


编写 RTL 代码 高 效率 的 最 重要 的 原则 是 分 而 治之 。 为 了 便于 找到 问题 之 所 
在 ， 应 尽量 将 设计 分 为 多 个 相互 之 间 没 有 关联 的 小 模块 。 预 先 估计 设计 中 可 能 
问题 的 地 方 ， 特 别 是 总 线 接口 ， 从 那里 着 手 开始 设计 。 系 统 设计 应 该 搞 成 这 样 : 
即使 所 有 的 模块 都 还 尚未 出 现 ， 设 计 师 还 是 能 够 运行 单个 模块 ， 并 对 其 进行 测 
试 。 系 统 设计 除了 有 助 于 开发 过 程 的 早期 工作 外 ， 当 设计 中 有 些 模块 正在 被 修改 
或 者 甚至 还 没有 时 ,设计 师 仍 可 使 设计 取得 进展 。 

遵循 良好 的 同步 设计 方法 。ASIC 设计 中 只 要 严格 地 控制 时 延 ， 使 用 异步 设 
计 是 允许 的 。 而 在 FPGA 设计 中 ， 绝 对 不 允许 使 用 异步 设计 ， 因 为 即使 严格 地 控 
制 时 延 ， 也 很 容易 造成 麻烦 。 在 设计 中 采用 流水 线 技 术 ， 同 时 寄存 所 有 的 端口 ， 
可 以 带 来 几 个 好 处 。 首 先 ， 可 以 将 组 合 逻 辑 划分 为 更 容易 综合 的 部 分 。 由 于 FP- 
GA 验证 工具 能 够 容易 地 访问 寄存 器 的 输入 和 输出 ， 所 以 流水 线 技术 使 调试 更 
加 容易 。 最 后 ， 通 过 寄存 器 位 置 的 改变 ， 流 水 线 技术 能 让 性 能 优化 有 更 多 的 选 


择 。 


52. FPGA 设计 : 基于 团队 的 最 佳 实践 


8.5.1 什么 是 最 好 的 硬件 设计 语言 


基于 本 书 的 目的 ， 我 们 仅 考虑 有 IEEE 标准 的 硬件 描述 语言 (HDL) ， 如 
VHDL, Verilog 和 SystemVerilog。 

在 遥远 的 过 去 ， 有 许多 种 面向 可 编程 逻辑 器 件 (PLD) 的 硬件 描述 语言 
(HDL) 。 其 中 一 些 语言 由 FPCA 厂商 开发 。 在 IEEE 批准 Verilog 和 VHDL 标准 
后 ， 这 两 种 语言 就 很 快 就 占领 了 ASIC 设计 市 场 ， 并 且 在 FPGA 市 场 日 益 普及 推 
广 。Verilog， 包 括 System Verilog， 和 VHDL 人 允许 用 户 只 使 用 一 种 语言 就 能 描述 设 
计 实 现 ， 还 能 描述 用 于 仿真 测试 的 激励 信号 ， 因 此 具有 很 大 的 优势 。 如 今 ， 旧 的 
PLD 语言 已 经 完全 被 Verilog 和 VHDL 代替 了 。 

那么 ， 对 FPGA 硬件 设计 而 言 ， 哪 一 种 硬件 描述 语言 更 好 呢 ? 

其 实 最 好 的 硬件 描述 语言 并 不 存在 。 所 有 符合 [EEE 标准 的 硬件 描述 语言 都 
有 各 自 的 优 缺 点 。 

VHDL 通常 比 Verilog 宛 长 ， 但 通常 却 也 有 更 丰富 的 特征 。VHDL 有 强大 的 类 
型 检查 机 制 ， 这 样 就 不 容易 犯 糊涂 的 错误 。 

Verilog 语言 风格 简练 但 类 型 定义 宽松 。 

总 而 言 之 ，Verilog 和 VHDL 都 能 很 好 地 完成 FPGA 设计 。 究 竟 选 择 哪 一 种 硬 
件 描述 语言 主要 由 个 人 偏好 所 决定 。 其 中 的 关键 因素 是 当选 择 一 种 硬件 描述 语言 
的 时 候 ， 确 信 已 经 完全 理解 了 这 门 语言 。 由 于 这 两 种 语言 都 有 很 多 不 明显 的 语义 
规则 ， 因 而 必须 仔细 研读 所 选择 语言 的 详细 资料 。 

学 习 硬 件 描述 语言 的 起 点 最 好 是 购买 一 份 HDL 的 IEEE 标准 。 虽 然 IEEE 标 
准 读 起 来 枯燥 乏味 ， 但 包含 了 HDL 设计 参考 书 经 常 忽略 的 细节 。 

因特网 上 有 从 白皮书 到 HDL 编码 训练 课程 的 丰富 材料 。 这 些 材 料 有 益 于 对 
硬件 描述 语言 产生 感性 认识 ， 也 有 助 于 建立 起 这 门 语言 的 基础 知识 。 众 多 技术 培 
训 中 心 、 本 地 高 等 院 校 、EDA 厂商 或 FPGA 厂商 都 会 提供 的 优质 HDL 课程 ， 建 
议 付 费 参 加 。 授 课 老 师 往往 会 讲授 书本 上 没有 覆盖 的 丰富 信息 ， 而 且 手 把 手 的 实 
验 会 给 你 一 些 工 具 使 用 方面 的 经 验 ， 将 来 可 用 于 设计 创新 。 

8. 5.1.1 在 设计 中 混合 使 用 由 不 同 语言 编写 的 模块 

市 面 上 大 多 数 EDA 综合 工具 支持 由 不 同 HDL 编写 的 模块 混合 而 成 的 设计 。 
然而 这 样 做 会 面临 一 些 很 难 克服 的 问题 ， 除 非 别 无 选择 ， 建 议 在 设计 中 最 好 不 要 
混用 由 不 同 语言 编写 的 模块 。 

什么 时 候 才 不 得 不 混用 不 同 的 设计 语言 ， 而 没有 其 他 办 法 呢 ? 

1. 购买 的 IP 是 使 用 另 一 种 HDL 编写 的 ， 与 公司 现 有 的 规定 不 同 。 

2. 重用 由 别 的 公司 完成 的 设计 ， 其 模块 是 用 另外 一 种 HDL 编写 的 。 

如 果 设 计 团 队 中 确 有 一 位 “天 才 ”， 他 习惯 使 用 与 公司 规定 不 同 的 HDL， 但 
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这 不 能 成 为 混用 不 同 设计 语言 的 理由 。 相 反 ， 这 个 “天 才 ” 需 要 服从 公司 已 有 
的 规定 。 

混用 不 同 语言 做 设计 可 能 会 遇 到 什么 问题 呢 ? 

1 容易 造 成 设计 不 可 移植 。 正 FE 标准 对 不 同 设计 语言 的 混用 没有 作出 任何 
规定 ， 因 此 EDA 工具 建立 它们 自己 的 规则 ， 这 很 有 可 能 导致 设计 的 不 可 移植 性 。 

2. Verilog 对 大 小 写字 母 敏感 ， 而 VHDL 却 不 是 这 样 。 如 果 设 计 师 采用 区 分 
大 小 写字 母 的 命名 策略 ， 很 有 可 能 把 自己 置身 于 雷 区 。 

3. 并 不 是 所 有 的 仿真 器 都 支持 设计 语言 的 混用 。 绝 大 部 分 主要 的 EDA 仿真 
工具 支持 设计 语言 的 混用 ， 但 是 费用 比 人 门 版 的 仿真 工具 高 。 

尽管 建议 避免 混用 不 同 的 设计 语言 ， 但 如 果 使 用 另 一 种 语言 编写 的 模块 中 引 
用 的 实例 或 实体 有 比特 类 型 或 向 量 类 型 的 端口 和 简单 参数 类 型 ， 那 么 混用 语言 所 
做 的 设计 还 是 可 以 正常 工作 的 。 


8. 5.2 良好 的 设计 习惯 


8. 5.2.1 代码 的 说 明文 档 
编写 清晰 的 说 明文 档 ， 对 设计 中 的 主要 模块 做 一 些 介 绍 ， 应 当成 为 设计 机 构 
的 常规 。 该 文档 用 来 对 描述 设计 的 RIL 代码 做 一 些 补充 说 明 。 它 应 该 包括 设计 
的 方块 图 和 分 层次 的 描述 ， 以 解释 设计 的 结构 。 它 还 应 包括 时 序 细节 的 描述 ， 例 
如 哪些 路 径 的 时 序 需要 异常 处 理 。 本 书 第 12 章 时 序 分 析 中 将 阐述 时 序 异 常 处 理 
的 细节 。 

设计 中 主要 模块 的 说 明文 档 ， 例 如 方块 图 对 设计 的 重用 至 关 重 要 。 如 果 不 知 
道 哪 几 个 功能 模块 是 需要 (外 购 IP) 重用 的 模块 ， 那 么 想 通 过 设计 重用 来 缩短 
设计 周期 就 不 太 可 能 实现 。 当 设计 师 回顾 以 往 所 完成 的 设计 ， 或 培训 团队 中 新 加 
盟 的 成 员 来 接替 设计 维护 或 完成 设计 模块 时 ， 设 计 文 档 也 是 十 分 有 帮助 的 。 

设计 模块 的 RTL 代码 应 该 具有 自明 性 ， 例 如 RTL 代码 中 信号 的 命名 规则 应 
当 能 描述 信号 是 做 什么 的 ， 如 dram _ ctrl]，regfile0 ，crc32，egress _ buffer 等 等 。 
注释 应 该 在 整个 RTL 代码 中 广泛 应 用 以 解释 代码 的 功能 ， 例 如 在 设计 中 标注 测 
试 信号 或 多 周期 路 径 ， 以 及 说 明 某 些 模块 的 用 途 。 
8. 5.2.2 ”对 信号 命名 规则 的 建议 

创建 公司 自己 的 命名 规则 ， 并 坚持 下 去 ! 

标准 的 命名 规则 需要 在 整个 公司 中 推行 。 

命名 规则 可 以 提高 代码 的 审核 效率 。 市 面 上 有 帮助 建立 编码 规范 和 强制 执行 
编码 标准 的 EDA 工具 。 强 烈 建议 购买 EDA Lint 工具 ， 强 制 执行 公司 的 编码 规 
范 。 同 时 编码 规范 也 应 成 为 与 版 本 控制 软件 交互 作用 的 一 部 分 。 为 了 通过 版 本 控 
制 工具 的 审核 ， 所 有 RTL 代码 必须 通过 Lint 工具 检查 ， 并 获得 健康 合格 证 明 书 。 
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正如 前 面 的 讨论 过 的 那样 ， 所 有 的 端口 、 信 号 和 变量 的 命名 都 应 该 有 意义 。 

下 面 是 一 些 标准 的 命名 规则 ， 可 以 考虑 作为 信号 命名 规则 的 一 部 分 。 

“reset” 或 “rst” : 复位 信和 号; 

“clock” 或 “clk”: 时 钟 信 和 号; 

“clk125 或 clock ”125”: 125 MHz 时 钟 信和 号; 

“rst125 或 resetl25”: 125 MHz 时 钟 信和 号 域 的 同步 复位 信号 ; 

后 缀 为 “_n”: 低 电 平 有 效 的 信号 或 者 差分 信号 的 负 半 部 分 例如 we _n 是 
一 个 低 电 平 有 效 的 写 入 使 能 信号 ; 

后 缀 为 “_p”: 差分 信号 正 半 部 分 ; 

前 缀 为 “a”: 异步 控制 信和 号， 例如 aclr 是 一 个 异步 清 零 信 号 ; 

前 级 “s”: 同步 控制 信和 号， 例如 sload 是 一 个 同步 置 数 信号 ; 

“en or ena”: 时 钟 使 能 信号 ; 

“ ack， valid， wait”: 总 线 控制 信号 ; 

使 用 大 写字 母 : 来 标识 参数 ， 枚 举 类 型 变量 和 和 常量 。 
虽然 一 般 常量 在 综合 阶段 无 关 紧 要 ， 但 是 它们 对 理解 逻辑 结构 非常 重要 。 

总 线 信 号 的 规则 : 

确保 使 用 总 线 顺序 的 一 致 性 。 业 界 最 通用 的 是 最 高 有 效 位 在 左 ( MSB)， 最 
低 有 效 位 (LSB) 在 右 ， 例 如 [63: 0] 。 

避免 在 声明 语句 中 省 略 低 有 效 位 ， 例 如 [7: 3]。 这 会 增加 设计 模块 在 连接 
时 产生 结构 化 错误 的 可 能 性 。 

然而 ， 忽略 未 使 用 的 最 高 位 却 没 有 问题 ， 例 如 用 [12: 0] 来 代替 [15: 0] 
是 安全 的 。 这 样 做 有 利于 减少 综合 工具 的 分 析 时 间 ， 同 时 也 可 以 减少 综合 工具 产 
生 的 警告 数量 。 
8. 5.2.3 ”层次 结构 和 设计 分 割 

层次 结构 对 于 设计 分 割 来 说 至 关 重 要 ， 应 该 精心 设计 。 合 适 的 层次 结构 有 助 
于 发 现 设 计 中 存在 的 问题 。 但 层次 过 多 的 结构 也 会 使 设计 难以 理解 。 因 此 ， 需 要 
使 层次 结构 保持 在 一 个 适中 的 深度 。 

平 铺 的 设计 实在 很 难 理 解 ， 而 且 会 给 调试 过 程 带 来 许多 困难 。 

应 该 按照 功能 边界 对 设计 进行 分 割 。 这 样 更 容易 看 出 设计 的 用 意 。 当 评判 设 
计 的 层次 分 割 时 ， 设 计 文件 的 层次 结构 应 该 与 方块 图 的 精神 一 致 ， 每 个 文本 文件 
对 应 一 个 Verilog/VHDL 模块 。 这 将 提高 对 设计 的 理解 ， 并 且 不 会 影响 EDA 工具 
进行 的 优化 。 因 为 除非 设计 师 明 确 指示 ， 和 否则 综合 工具 将 自由 地 跨 模块 边界 进行 
优化 。 

这 样 做 的 好 处 是 有 利于 子 设计 的 独立 仿真 。 这 也 使 得 设计 师 能 对 模块 进行 快 
速 的 性 能 分 析 。 
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当 根据 功能 边界 进行 设计 分 割 时 ， 设 计 师 应 该 寄存 模块 所 有 的 输入 和 输出 。 
这 可 能 会 以 增加 设计 的 延迟 为 代价 ， 然 而 带 来 的 好 处 通常 远 远 超过 付出 的 代价 。 
在 时 序 收敛 时 ， 这 种 隔离 模块 的 做 
法 能 帮 大 忙 ， 因 为 关键 路 径 通常 包 
含 在 一 个 分 割 区 域内 并 且 能 与 设计 
的 其 余部 分 独立 运行 ( 见 图 827)。 

最 近 几 年 中 ， 这 种 极其 有 价值 
的 建议 几乎 没有 被 100% 的 设计 师 
所 重视 。 因 为 寄存 模块 所 有 的 输入 
和 输出 需要 对 设计 进行 前 期 规划 。 
而 设计 师 们 常 犯 的 错误 是 顺 着 自己 有 益 于 增 量 编译 的 合理 设置 。 
的 感觉 去 做 设计 ， “如 果 以 后 需要 ， 这 是 一 个 硬 需求 吗 ” 不是， 只 要 努力 去 做 。 
我 再 考虑 模块 端口 的 寄存 "。 这 种 说 
法 极 大 地 低估 了 不 重视 前 期 规划 所 人 
造成 的 返工 花费 。 后 期 任何 的 延迟 改变 将 会 波及 到 设计 的 其 余部 分 。 

当 进 行 设计 分 割 的 时 候 ， 设 计 师 必须 避免 在 各 分 割 部 分 间 插 入 胶合 逻辑 ， 如 
图 8-8 所 示 。 


模块 最 小 化 ， 并 使 关 
键 路 径 在 一 个 模块 中 


寄存 器 寄存 最 终结 果 


习 8-8” 差 的 分 制 和 好 的 分 割 示例 


不 要 在 分 层 边 界 上 使 用 三 态 或 者 双向 端口 ， 除 非 它们 一 直 和 器 件 的 IO 引 脚 
接口 。 这 是 因为 在 FPGA 器 件 的 内 部 没有 三 态 总 线 ， 实 际 硬 件 的 三 态 功 能 是 用 多 
路 复 用 器 来 实现 的 。 大 在 分 层 模 块 的 边界 上 使 用 了 三 态 或 者 双向 端口 ， 则 造成 模 
型 仿真 行为 与 实际 硬件 行为 的 不 一 致 ， 这 很 难 理解 。 
建议 使 用 如 图 8-9 所 示 的 详细 方法 来 处 理 这 个 
问题 。 Input : my_bus_in[16]; 

RN ee ee Output : my_bus_out[16]; 

良好 的 设计 分 割 使 设计 师 能 够 采用 分 而 治之 的 Output : my_bus_oe; 
方法 来 建立 优化 的 设计 模块 。 人 

构建 模块 可 以 并 行 开发 ， 当 然 也 可 由 不 同 小 组 。 ”图 89 处 理 分 割 边界 
Si 上 三 态 的 代码 示例 


“ 56. FPGA 设计 : 基于 团队 的 最 佳 实 践 


确定 需要 编写 Verilog 代 码 功能 测试 ”速度 /面积 “优化 的 模块 
的 子 功能 


评估 


图 8-10 用 于 RTL 设计 的 分 而 治之 方法 


花费 很 少 努力 就 可 将 这 些 优化 的 子 模块 组 合成 一 个 优化 的 系统 〈 见 图 8- 


11)。 


优化 的 子 模块 合并 形成 顶层 模块 编译 到 FPGA 


优化 的 顶层 模块 


8. 5.2.4 设计 的 重用 


板 纹 测试 


图 8-11 组 合子 模块 来 创建 优化 的 设计 模块 


这 本 书 中 将 用 完整 的 一 章 专门 来 讲述 设计 的 重用 。 在 本 节 中 我 们 将 阐述 


HDL 编码 风格 是 如 何 影响 设计 重用 的 。 


奉 某 设计 是 采用 同步 设计 方法 完成 的 ， 而 且 其 层次 结构 的 划分 十 分 合理 ， 则 


该 设计 就 有 重用 的 可 能 性 。 


将 某 个 成 功 的 FPGA 设计 作为 一 个 整体 ， 融 


入 下 一 代 世 片 中 ， 加 以 重复 利用 


的 现象 十 分 常见 。 这 也 许 是 为 了 削减 产品 成 本 的 缘故 。 例 如 ， 为 了 下 一 代 的 新 系 


统 能 有 更 多 的 功能 ， 设 计 师 先 把 多 个 设计 融合 到 一 个 更 大 的 FPCA 器 件 上 ， 然 后 


再 移植 到 专用 集成 电路 (ASIC) 上 实现 。 


经 过 优化 的 模块 通常 可 以 重复 利用 。 但 是 奉 在 设计 中 使 用 了 某 特定 融 件 系列 
中 专用 的 原 语 元 件 ， 则 该 模块 可 能 需要 做 一 些 修改 后 才能 重用 。 
下 面 列 出 了 哪些 要 素 造 就 高 质量 的 可 重用 FPCA 组 件 模块 : 
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1. 目标 和 功能 都 十 分 清晰 的 模块 ; 

2. 能 通过 参数 的 设置 满足 不 同 用 户 定制 需求 的 模块 ; 

3. 独立 可 测 的 模块 ; 

4. 输入 /输出 端口 拥有 信和 号 寄存 器 的 模块 。 这 可 以 为 时 序 收敛 提供 保 隐 ; 
5 

6 


. 使 用 标准 协议 接口 的 模块 ; 

. 有 清晰 明了 注释 的 RTL 代码 模块 ; 

. 接口 信号 数目 不 太 多 的 模块 。 模 块 接口 信号 太 多 会 造成 与 其 他 设计 模块 
连接 的 困难 。 

高 质量 的 可 重用 FPGA 组 件 模块 需要 避免 : 

1. 模块 的 层次 太 多 ; 

2. 模块 过 小 ; 

3. 模块 需要 的 专用 信号 太 多 ， 这 样 会 造成 与 其 他 设计 模块 连接 的 困难 。 
8. 5.2.5 缩短 设计 周期 的 技术 

通过 仿真 和 综合 技术 可 以 缩短 RTL 代码 的 设计 周期 。 

多 花 一 些 功 夫 从 最 底层 向 上 ， 对 子 设 计 进 行 功 能 仿真 会 发 现 很 多 问题 。 等 到 
对 整个 设计 进行 全 面 仿真 ， 或 对 电路 板 上 运行 的 芯片 进行 调试 时 ， 发 现 有 问题 ， 
就 很 难 找到 问题 的 根源 。 从 最 底层 起 开始 调试 也 许 很 及 烦 ， 但 是 在 设计 的 最 底层 
发 现 并 消除 错误 却 要 快 得 多 和 容易 得 多 。 

有 许多 技术 能 缩短 RIL 代码 的 综合 时 间 ， 以 下 列举 三 个 技术 : 

1， 进 行 面积 评估 。 运 行 综合 工具 后 可 得 到 关于 设计 规模 的 大 致 数据 。 设 计 
者 也 许 会 问 ， 为 什么 得 到 的 是 大 致 的 而 不 是 精确 的 结果 呢 ? 主要 原因 有 两 个 。 首 
先 ， 当 此 模块 是 与 其 他 模块 结合 时 ， 绿 合 工 具 将 进行 一 系列 的 跨 模 块 的 优化 。 其 
次 ，FPGA 布局 布线 工具 还 要 进行 一 些 优 化 ， 例 如 : 用 LUT 包装 无 关 的 寄存 器 、 
合并 存储 块 。 

2.， 当 子 模块 的 设计 马上 就 要 完成 的 时 候 ， 对 子 模块 进行 布局 布线 以 确认 其 
全能。 如 果 刚 好 满足 性 能 需求 ， 那 么 应 该 尽量 为 完整 设计 的 集成 留 有 一 些 的 余 
量 。10% 的 余 量 就 行 了 ， 当 然 15% 的 余 量 更 好 。 

3. 在 设计 周期 的 初期 ， 应 尽量 避免 进行 任何 手动 布局 或 布局 规划 ， 而 是 应 
通过 修改 RTL 源 代码 来 满足 性 能 目标 。 

有 时 候 这 样 做 不 能 马上 解决 问题 。 当 遇 到 这 类 情况 之 一 时 ， 应 该 在 设计 文档 
中 详细 记录 ， 并 利用 增 量 设计 方法 来 锁定 该 模块 已 经 达到 的 性 能 。 

设计 师 要 尽量 减少 需要 运行 的 设计 迭代 次 数 。 因 为 对 大 型 FPCA 器 件 而 言 ， 
迭代 时 间 是 昂贵 的 开销 。 在 大 多 数 综合 工具 中 ， 综 合 器 运行 时 间 的 长 得 与 设计 规 
模 的 大 小 大 致 成 线性 关系 。 综 合 工 具 必须 完成 的 工作 越 艰难 ， 综 合 花 费 的 时 间 就 
越 长 ， 与 布局 布线 花费 的 时 间 十 分 类 似 。 


| 


| 
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当 构 建设 计时 设计 师 需 要 记 住 逻辑 块 的 构造 越 简单 ， 设 计 的 性 能 就 越 好 ， 综 
合 所 需 的 时 间 就 越 短 。 实 际 上 ， 流 水 线 级 数 多 的 设计 因 其 逻辑 块 的 构造 更 加 人 简 
单 ， 所 以 速度 性 能 更 好 ,综合 所 需 的 时 间 更 短 。 

如 果 设 计 的 逻辑 构造 过 于 复杂 ， 那 么 综合 器 就 不 得 不 反复 地 分 析 代 码 中 的 逻 
辑 功 能 ， 解 析出 复杂 的 逻辑 构造 ， 从 而 造成 综合 时 间 过 长 。 
8. 5.2.6 ”针对 调试 的 设计 

在 第 13 章 (系统 在 线 调 试 ) 中 ,我 们 将 更 深入 地 讨论 本 话题 。 本 节 将 先 介 
绍 一 些 在 RTL 代码 级 用 于 提高 系统 在 线 调 试 能 力 的 设计 技术 。 

1. 用 寄存 器 保存 想 要 观察 的 芯片 内 部 信 叶 。 这 样 做 的 话 ， 这 些 信 号 就 不 太 
可 能 被 综合 器 优化 掉 。 

2. 为 便于 调试 ， 把 设计 划分 成 多 个 层次 。 例 如 ， 如 果 设 计 师 想 要 观察 某 个 
接口 ， 可 以 将 该 接口 配置 在 器 件 边沿 的 输入 /输出 引 脚 上 ， 以 便于 监测 。 

3. 编写 从 最 终 设计 中 能 很 容易 提取 到 的 测试 模块 。 

4. 确保 FPGA 器 件 中 还 有 未 使 用 的 存储 器 资源 和 逻辑 资源 ， 以 便 配置 代入 
式 逻 辑 分 析 仪 ， 用 于 片 内 逻辑 电路 的 调试 。 

5. 保留 一 些 空闲 引 脚 ， 以 备 调 试 信号 访问 之 用 。 


8. 5.3 可 综合 的 HDL 


开发 大 多 数 人 硬件 描述 语言 (HDL) 的 目的 原本 只 是 为 了 功能 仿真 ， 而 不 是 
为 了 将 代码 转换 成 电路 。 因 此 ， 用 HDL 描述 电路 的 功能 十 分 容易 ， 但 这 个 功能 
却 不 能 用 硬件 可 靠 地 实现 。 设 计 师 必须 意识 到 许多 综合 工具 仍 会 把 有 问题 的 代码 
也 转换 成 电路 网 表 ， 而 网 表 的 运行 结果 与 代码 的 功能 仿真 结果 很 可 能 不 一 致 。 本 
节 将 不 举例 介绍 那些 存在 问题 的 代码 ， 而 是 建议 设计 师 花 钱 参 加 RTL 编码 培训 
课程 或 花 时 间 认 真 读书 学 习 。Verilog 和 VHDL 标准 中 有 一 个 可 综合 子 集 ， 所 有 
的 综合 工具 都 能 理解 用 该 子 集 编写 的 RTL 代码 。 采 用 这 个 子 集 编写 的 RTL 代码 ， 
综合 后 的 电路 运行 结果 将 与 RTL 代码 的 功能 仿真 结果 完全 相同 。 设 计 师 要 学 习 
并 严格 遵循 这 个 可 综合 的 子 集 。 

下 面 列 出 了 设计 可 综合 模块 的 三 条 指导 原则 . 

1. 在 描述 可 综合 的 设计 时 ， 头 脑 中 要 有 明确 的 人 硬件 意识 。 也 就 是 说 ， 用 逻 
辑 门 和 寄存 器 确切 定义 电路 的 功能 。 

2. 清楚 地 知道 目标 器 件 的 局 限 性 。 

3. 当 设 计 成 功 通过 综合 后 ， 检 查 并 消除 综合 工具 中 出 现 的 警告 信息 。 

8. 5.3.1 编码 风格 
在 创建 设计 时 首先 需要 明确 将 要 进行 的 设计 是 结构 设计 还 是 行为 设计 ? 
在 设计 实践 中 ,设计 师 将 使 用 也 应 该 使 用 结构 的 和 行为 的 两 种 编码 风格 。 老 
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学 院 派 的 FPGA 设计 师 将 会 告诉 你 必须 要 使 用 高 度 结构 化 的 设计 以 保证 设计 的 实 
现 和 性 能 。 实 际 上 ， 这 样 做 仅 对 那些 推进 性 能 指标 的 设计 是 正确 的 。 如 果真 有 此 
类 情况 的 话 ， 也 仅仅 是 设计 中 很 少 的 一 部 分 。 

顶层 模块 总 是 用 线 网 连 ， 把 许多 个 子 实例 集合 在 一 起 。 

大 部 分 子 模 块 采用 行为 化 的 风格 来 实现 核心 功能 。 
建议 设计 师 从 推荐 的 可 综合 编码 规范 中 使 用 最 简洁 的 语言 结构 描述 设计 。 这 
样 做 使 得 设计 的 功能 更 容易 理解 。 
编写 的 代码 行 数 越 少 ， 需 要 调试 的 代码 行 数 也 就 越 少 。 这 是 一 条 编码 的 常 


识 。 
只 有 在 必需 的 时 候 才 可 以 实例 引用 基本 原 语 元 件 。 为 了 满足 性 能 需求 或 者 使 
用 FPCA 器 件 的 某 些 独特 功能 ， 例 如 使 用 输入 /输出 〈LO) 原 语 元 件 ， 收 发 器 
模块 等 ， 才 有 这 样 做 的 必要 。 
8. 5.3.2 常用 Verilog 编码 指导 原则 
本 书 不 准备 广泛 地 讲解 Verilog 编码 的 指导 原则 ， 只 提出 五 条 最 重要 的 编码 
建议 。 
1. 购买 一 本 Verilog RTL 编码 的 参考 书 或 者 一 份 IEEE Verilog 标准 。 
2. 理解 非 阻塞 赋值 ( < = ) 和 阻塞 赋值 之 间 ( = ) 的 差异 。 
在 组 合 逻 辑 建 模 中 使 用 阻塞 赋值 (“ =”)， 
在 跳 变 沿 触发 的 always 模块 中 使 用 非 阻 塞 赋值 (“ < =”)， 
除了 以 下 两 种 情况 : 
例外 1: 给 临时 变量 赋值 ; 
例外 2: 给 先 写 后 读 的 RAM 赋值 。 
3. 注意 表达 式 的 位 宽 。 
16 比特 向 量 可 以 直接 赋值 给 8 比特 向 量 。 
表达 式 的 内 容 能 改变 操作 数 的 位 宽 ， 即 操作 数 的 精度 。 
4. 注意 表达 式 的 符号 
在 复杂 的 表达 式 中 ， 只 要 有 一 个 无 符号 操作 数 就 能 够 强制 改变 所 有 操作 
数 的 符号 ， 例 如 unsigned _a + signed _b + signed _c。 
5. 注意 隐 含 的 线 网 声明 。 
8. 5.3.3 ”常用 的 VHDL 编码 指导 原则 
与 上 一 小 市 一 样 ， 本 书 不 准备 广泛 地 讨论 VHDL 编码 的 指导 原则 ， 只 是 提 
出 四 条 最 重要 的 建议 。 
1. 购买 一 本 VHDL RTL 编码 的 参考 书 或 者 一 份 [EEE VHDL 标准 。 
2. 标准 封装 库 的 合理 使 用 。 
使 用 时 钟 信号 的 上 升 沿 和 下 降 沿 作 为 跳 变 沿 触发 条 件 (ieee. std _ logic _ 
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1164) ; 用 ieee. numeric std 和 ieee. numeric _bit 程序 包 作 为 无 符号 和 有 符号 类 
型 数据 操作 的 算术 运算 库 。 

3. 不 要 在 case 语句 的 条 件 中 使 用 “X”、“U”、“Z”、“ - ”这 些 元 值 。 

在 VHDL 语言 中 操作 符 “=” 需 要 精确 匹配 。 

村 别 需要 注意 的 是 “X” 和 “=- ”的 行为 与 无 关 项 不 同 。 

4. 用 实际 的 动态 范围 来 约束 整数 的 子 类 型 ， 例 如 用 integer range 7 -0 来 约 
束 整数 范围 。 这 样 做 可 以 优化 整数 的 位 宽 ， 从 而 减少 硬件 的 开销 。 
8. 5.3.4 提高 性 能 的 设计 方法 

FPGA 设计 达到 最 快 时 钟 性 能 的 主要 做 法 是 采用 流水 线 技术 。 请 记 住 这 一 
点 ,无论 寄存 器 使 用 与 否 ， 它 们 都 存在 于 FPGA 单元 的 结构 之 中 ， 并 不 因为 你 没 
有 使 用 寄存 器 可 以 使 FPGA 变 小 。 

设计 师 应 根据 说 明 书 上 列 出 的 查找 表 个 数 和 寄存 器 延迟 参数 ， 选 择 一 款 逻 辑 
规模 和 速度 性 能 都 符合 设计 需求 的 FPGA ， 作 为 实现 设计 的 目标 器 件 。 设 计 师 在 
设计 所 有 子 模块 的 过 程 中 应 该 维持 这 个 既定 的 目标 器 件 。 

在 综合 工具 和 物理 综合 工具 中 有 高 级 设置 ， 可 以 使 用 诸如 寄存 器 重 定 时 等 技 
术 来 提高 性 能 。 这 有 利于 修正 设计 中 少量 的 长 路 径 。 然 而 ， 在 RTL 代码 中 进行 
手动 修正 ， 既 可 以 保证 设计 的 性 能 ， 又 可 以 减少 编译 时 间 ， 而 且 可 使 设计 模块 可 
重用 。 即 使 升级 到 更 新 版 本 的 FPGA 设计 软件 ， 这 种 方法 也 同样 可 以 保证 设计 模 
块 的 实现 。 

图 8-12 展示 了 一 个 在 寄存 器 间 具 寄存器 的 本 导 迎 加 
有 两 层 逻 辑 的 设计 。 人 > 

尽 可 能 地 使 设计 流水 线 化 。 图 8- | Re ?| 
13 展示 了 如 何 添加 流水 线 级 帮助 布局 
布线 达到 性 能 要 求 。 如 果 数 据 路 径 国 61 家 部 咒 间 内 的 并 LT 
( 见 图 8-13) 的 输入 和 输出 引 脚 被 分 别 安置 在 这 条 数据 路 径 的 两 端 ， 从 而 造成 数 
据 路 径 贯 穿 整个 芯片 , 在 这 条 路 径 上 “无 用 的 ”寄存 需 则 可 以 被 用 于 分 拆 这 个 长 
的 布线 延迟 ， 使 得 设计 满足 时 钟 要 求 。 

时 序 余 量 

设计 子 模块 的 时 候 ， 设计 师 总 是 应 该 提前 考虑 系统 的 时 序 收敛 问题 。 单 独 编 
译 每 个 子 设计 ， 并 使 用 静态 时 序 分 析 工 具 监 控 其 时 序 性 能 。 设 计 师 应 该 总 是 为 每 
个 子 设计 的 时 序 需 求 留 有 足够 的 余 量 。 这 将 为 整个 设计 的 融合 留 有 时 序 余 量 。 

每 个 子 设 计 单独 执行 布局 时 ， 能 够 得 到 最 优 的 布局 布线 。 然 而 ， 把 许多 子 设 
计 整 合成 一 个 大 设计 的 时 候 ， 并 不 是 每 一 个 子 设 计 都 能 在 整个 芯片 上 实现 最 优 的 
布局 布线 。 设 计 师 应 该 预 估计 到 整合 后 的 设计 将 产生 10% ~ 15% 的 速度 退化 。 
时 序 问题 的 预防 比 事后 再 修改 系统 时 序 的 设计 要 容易 得 多 。 设 计 师 可 能 不 想 把 自 
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己 置 于 这 样 的 困境 ， 即 设计 后 期 ,设计 指标 的 一 个 小 改动 就 导致 时 序 从 勉 强 满足 
变 成 不 满足 ， 从 而 导致 产品 上 市 时 间 的 推迟 。 


| 


“无 用 的 ”寄存 
器 的 出 现 能 节省 
布局 布线 的 时 间 


| 


图 8-13 ”使 用 流水 级 数 来 拆 分 布线 延迟 


已 


不 要 相信 综合 工具 的 时 序 估 计 报告 。 布 局 对 时 序 有 很 大 的 影响 。 

子 设计 往往 比较 小 ， 所 以 完成 真实 布局 布线 后 的 时 序 仿真 不 需要 花 太 多 的 运 
行 时 间 。 

8. 5.3.5 针对 面积 优化 的 设计 过 程 

当 编 写 RIL 代码 的 时 候 , 琢磨 一 下 正在 构建 的 逻辑 是 什么 电路 。 例 如 ， 想 用 
一 个 加 法 器 还 是 两 个 加 法 器 ?是 否 能 编写 RIL 代码 只 用 一 个 加 法 器 来 实现 这 个 
电路 ? 

熟悉 目标 FPCA 器 件 的 逻辑 结构 。 寄 存 器 上 有 什么 控制 信号 可 用 ?7 查找 表 
(LUT) 的 构造 是 怎样 的 ? 是 4 输入 的 LUT， 还 是 6 输入 的 LUT ? 

查看 综合 报告 ， 对 所 使 用 的 逻辑 有 一 个 基本 准确 的 估计 。 大 部 分 综合 工具 详 
细 地 列 出 各 个 层次 的 资源 利用 情况 。 这 有 助 于 核定 是 否 有 些 模 块 比 预期 消耗 了 更 
多 的 逻辑 资源 。 

对 更 小 的 设计 模块 ， 应 该 使 用 网 表 查 看 工具 来 分 析 优 化 情况 ， 例 如 电路 中 有 
一 个 加 法 器 还 是 两 个 加 法 器 ， 等 等 。 

如 果 在 设计 中 存在 很 慢 的 逻辑 ， 那 么 就 可 以 考虑 使 用 时 分 复 用 提高 资源 使 用 
效率 。 这 种 方法 在 DSP 设计 中 很 常见 ，DSP 设计 中 有 限 脉 冲 响应 滤波 器 (FIR)， 
其 运行 速率 可 以 选择 2 倍 或 者 4 倍 ， 以 节约 资源 。 

当 检查 设计 的 时 候 ， 经 常会 发 现 完 全 相同 的 寄存 右 和 逻辑 块 。 这 是 由 于 几 个 
模块 的 功能 完全 相同 而 造成 的 。 尽 管 少量 的 电路 复制 可 能 有 助 于 提高 运行 速度 ， 
但 是 去 除 这 些 重复 的 电路 ， 可 以 节省 很 多 的 面积 。 如 果 设 计 师 发 现 可 以 节省 大 量 
的 面积 ， 这 表明 设计 层次 的 划分 做 得 很 差 。 此 时 ， 应 该 考虑 为 设计 专门 构造 一 个 
层面 ， 用 于 放置 公共 模块 。 
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8. 5.3.6 综合 工具 的 设置 

为 了 优化 设计 使 其 达到 规定 的 技术 指标 ， 所 有 综合 工具 都 包含 很 多 设置 选 
项 。 尽 管 这 些 设 置 非常 有 效 ， 然 而 却 并 不 能 保证 在 将 来 的 EDA 工具 版 本 中 也 有 
完全 相同 的 效果 。 使 用 综合 髓 的 高 级 设置 ， 实 际 上 就 消除 了 RTL 代码 可 重用 的 
保障 。 因 此 ， 不管 EDA 综合 工具 的 广告 资料 如 何 吹 咕 ,我 们 还 是 建议 使 用 默认 
的 设置 来 做 综合 。 尽 量 通过 修改 RTL 代码 做 综合 优化 ， 以 确保 设计 的 可 重用 性 。 
略为 达到 设计 目标 ， 不 得 不 使 用 某 项 设置 ， 则 应 该 在 该 模块 的 文档 中 对 此 做 完整 
的 记录 并 加 以 说 明 。 
8. 5.3.7 FPGA 设计 块 的 推断 

随机 访问 存储 器 (RAM): 

大 部 分 综合 工具 能 够 根据 代码 推断 出 可 进行 基本 单 读 单 写 操作 的 RAM 块 。 
有 些 综合 工具 还 能 够 根据 代码 推断 出 真正 的 双 端 口 RAM 块 。 

综合 工具 不 能 根据 代码 推断 出 FPCA 器 件 内 舰 RAM 块 的 所 有 高 级 功能 。 然 
而 ， 可 以 通过 在 RTL 代码 的 注释 中 添加 综合 属性 (指令 ) 或 通过 实例 引用 参数 
化 RAM ( 原 语 ) 组 件 来 实现 这 些 功 能 。 

当 编 写 访问 RAM 组 件 的 RTL 代码 时 ,设计 师 应 该 清楚 自己 编写 的 可 综合 
RTL 代码 的 读 / 写 控制 行为 必须 与 RAM 宏 组 件 的 外 部 读 / 写 控制 逻辑 完全 匹配 。 

当 描述 RAM 模块 时 ， 建 议 根 据 综合 工具 提供 的 RAM 模板 着 手 设计 。 设 计 
完成 之 后 ， 就 可 以 创建 自己 的 RAM 读 写 模型 库 ， 在 后 续 的 设计 中 可 以 重复 利用 
该 RAM 模型 库 。 这 样 做 背后 的 思想 是 提前 解决 综合 工具 中 有 关 RAM 器 件 的 所 
有 推断 问题 。 当 综合 时 ， 可 以 很 容易 地 使 用 实例 引用 的 RAM 宏 组 件 来 代替 代码 
中 的 RAM 和 读 写 控制 逻辑 。 

应 避免 在 写 操 作 期 间 做 读 操作 。 综 合 工 具 需 要 般 入 额外 的 逻辑 才能 实现 同时 
读 写 的 功能 。 骨 入 的 逻辑 将 会 使 设计 的 面积 增加 ， 并 且 使 设计 的 速度 变 慢 。 

写 操作 期 间 进 行 读 操作 的 行为 

若 对 同一 地 址 同时 进行 读 / 写 操作 ， 则 读 取 的 是 旧 数 据 还 是 新 数据 呢 ? 这 取 
决 于 HDL 代码 的 编写 。 

图 8-14 展示 了 一 段 代码 的 细节 ， 该 段 代码 表明 硅 对 同一 地 址 同时 进行 读 写 
操作 , 从 RAM 中 读 取 的 是 新 写 人 的 数据 。 

图 8-15 展示 了 另 一 段 代 码 的 细节 ， 该 段 代 码 表明 若 对 同一 地 址 同时 进行 读 
写 操作 ， 从 RAM 中 读 取 的 是 原来 保存 的 旧 数 据 。 

图 8-16 展示 了 一 段 代 码 的 细节 ， 该 段 代码 对 RAM 进行 初始 化 。 

只 读 存 储 右 

EDA 综合 工具 能 够 检测 到 可 以 用 存储 器 块 中 的 ROM 组 件 实现 的 寄存 器 组 和 
逻辑 。 图 8-17 展示 如 何在 代码 中 使 用 case 语句 ， 并 用 寄存 器 保存 输出 ， 从 而 描 
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述 ROM 的 行为 。 


always(@(posedge clk) begin 
if(we) ram[addr] = data; // 
阻塞 赋值 写 入 
q < 二 ram[addr]; // 如 果 we 
==1'b1,q 读 入 新 数据 


end 


操作 ， 读 取 的 是 新 写 信 的 数据 


-一 把 RAM 初始 化 为 全 1 


// 把 RAM 初始 化 为 全 1 

ram[31: 0] ram[0 :15]; 

initial 

begin 

for=0:i<16: i=it1) ramf[i |=1; 
end 


有 限 状 态 机 


图 8-14 ”对 同一 地 址 同时 进行 读 / 写 


Signal my_ram :ram t:= (other=>'1') 


图 8-16 把 RAM 的 内 容 初始 化 为 全 1 


always@(posedge clk) begin 
if(we) ram[addr] <= data; // 非 阻 塞 赋值 


q <= ram[addr]; // q 读 地 址 addr 中 的 旧 的 


图 8-15 ”对 同一 地 址 同时 进行 读 / 写 
操作 ， 读 取 的 是 原来 保存 的 旧 数 据 


always @ (posedge clock) 

begin 

case (address) 

8'b00000000: data_out = 6' b101111; 
8'b00000001: data_out = 6' bl110111; 
8'b11111110 : data_out = 6’ bO00001; 
8'bl1111111 : data_out= 6'b101010,; 
endcase 

end 


图 8-17 描述 ROM 的 行 》 


编写 有 限 状态 机 的 时 候 ， 应 该 总 是 使 用 异步 复位 。 否 则 ,综合 工具 将 猜测 复 


位 状态 ， 从 而 可 能 导致 设计 的 功能 问题 ( 见 图 8-18)。 
在 VHDL 语言 中 ， 从 枚 举 类 型 的 信号 /变量 可 以 得 到 有 限 状 态 机 ( 见 图 8- 


19) 。 


图 8-18 ”有限 状态 机 


type state type is (S0, S1, S2, S3); 
signal my_ fsm : state_type; 
State names based on the enum names 


图 8-19 ”使 用 VHDL 枚 举 类 型 
来 表示 有 限 状 态 机 


在 用 Verilog 语言 编写 的 程序 中 ， 我 们 可 以 从 具有 以 下 四 个 属性 的 变量 推断 


出 程序 中 有 FSM (有限 状态 机 ) 存在 : 


1. 以 常量 表达 式 或 者 模块 参数 被 赋值 的 变量 ; 
2. 未 被 声明 为 输出 端口 的 变量 或 者 未 被 用 于 端口 连接 的 变量 ; 


3. 作为 整体 被 引用 或 者 被 赋值 的 


“64 FPGA 设计 : 基于 团队 的 最 佳 实践 


4. 状态 名 是 以 二 进 制 表示 的 数值 ， 或 者 是 以 参数 表示 的 数值 
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下 面 是 一 个 Verilog 有 限 状态 机 (FSM) 示例 ， 其 细 广 如 图 8-20 所 示 。 


描述 有 限 状 态 机 时 ， 一定 要 指定 复位 状态 ， 不 能 忽略 : 
在 VHDL 中 , 使 用 STATE_TYPE，FIRST 进行 复位 。 
在 Verilog 中 ， 复 位 时 把 状态 值 置 为 0 或 置 为 最 小 值 。 
状态 机 编码 风格 

大 部 分 FPGA 综合 工具 都 认可 默认 的 状态 机 编码 风格 。 


独 热 编码 常 被 用 于 由 FPGA 器 件 实现 的 RM， 这 是 由 FPGA 的 特殊 结构 所 决 
定 的 。FPCA 器 件 中 每 个 单元 的 肩 入 较 少 ， 而 寄存 器 却 很 丰富 ， 这 正好 符合 独 热 


码 状 态 机 对 人 硬件 结构 的 需求 。 


二 进 制 〈 比 特 位 最 少 ) 码 或 者 格雷 码 通常 用 于 由 CPLD 或 者 乘积 项 器 件 实现 
的 FSM。 这 两 种 器 件 的 结构 特点 是 寄存 器 较 少 而 扇 人 却 很 多 ， 这 正好 符合 这 两 


种 编码 状态 机 对 硬件 结构 的 需求 〈 见 图 8-21 ) 。 


localparam SO=0, S1=1, S2=2, S3=3; 
reg[2:0] state_reg; 状态 二 进 制 编码 格雷 编码 
always (@ (posedge clk or negedge reset) 


if (~reset) 
state_reg <= S0; 
else 


case (state_reg) 
SO: stste_reg <= S1; 
Sl1: stste_reg <= S$2; 
S2: stste_reg <= $3; 
S3: stste_reg <= S3; 
Endcase 


图 8-20 用 Verilog 语言 图 8-21 状态 机 编码 风格 


编写 的 有 限 状 态 机 


安全 的 状态 机 


独 热 编码 


00001 
00010 
00100 
01000 


10000 


由 于 FPCA 器 件 中 有 丰富 的 寄存 器 资源 ， 因 此 通常 使 用 独 热 码 状 态 机 。 然 


而 ,7 比特 的 编码 就 有 2" -nn 个 非法 状态 。 在 默认 条 件 下 ，FPGA 毕 


合 工 具 会 把 


设计 师 人 工 编写 的 安全 复位 逻辑 给 优化 掉 。 通 常 综合 工具 提供 一 个 安全 状态 机 的 


选项 ， 在 综合 工具 中 可 以 设置 这 个 选项 ， 也 可 以 在 源 代码 中 添加 


pe 
综合 


属性 注释 ， 


都 能 实现 安全 复位 的 目的 。 由 于 硬件 中 的 噪声 和 混乱 事件 很 可 能 导致 状态 机 进入 


不 确定 的 状态 ， 因 此 务必 使 用 该 选项 。 


在 编写 状态 机 代码 时 如 果 没 考虑 未 定义 的 状态 ， 很 可 能 导致 综合 后 生成 的 便 
件 在 运行 时 神秘 地 死 锁 。 考 虑 未 定义 的 状态 是 一 种 良好 的 工程 编程 习惯 。 


大 型 复杂 的 状态 机 
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用 上 伦 入 式 处 理 器 实现 大 型 复杂 的 状态 机 较为 理想 。 

大 部 分 FPGA 厂商 提供 的 软 处 理 器 可 以 使 用 “C” 编 程 环境 来 描述 状态 机 的 
操作 ， 所 以 实现 大 型 复杂 的 状态 机 十 分 容易 。 当 使 用 专门 的 硬件 来 实现 状态 机 
时 ， 每 增加 一 个 状态 或 状态 转移 都 会 增加 硬件 资源 的 开销 。 使 用 软 处 理 咒 的 优势 
在 于 除了 存储 资源 外 ， 不 管状 态 机 多 么 复杂 ， 硬 件 资 源 的 开销 是 固定 的 ， 只 有 存 
储 器 资源 的 开销 取决 于 状态 机 的 复杂 程度 。 所 请 处 理 恬 ， 其实 就 是 一 个 有 很 多 状 
态 的 状态 机 。 这 些 状 态 可 以 存储 在 处 理 器 的 寄存 器 组 中 ， 也 可 以 保存 在 处 理 器 可 
用 的 内 存 中 。FPGA 三 商 提供 软 处 理 器 的 好 处 在 于 如 果 状 态 机 太 复 杂 ， 而 FPCA 
的 硬件 资源 又 不 够 大 时 ， 可 以 通过 扩大 存储 器 资源 ， 实 例 引 用 硬件 规模 固定 的 软 
处 理 器 核 ， 用 FPCA 实现 极其 复杂 的 状态 机 。 

FPCA 广 商 提 供 了 详细 的 软 处 理 器 使 用 说 明 书 ， 指 导 用 户 如 何在 FPCA 中 使 
用 软 处 理 器 来 实现 复杂 的 状态 控制 。 

DSP 组 件 

大 多 数 FPGA 器 件 内 部 都 包含 有 一 定数 量 的 专用 优化 乘法 圳 硬件 。 

FPCA 综合 工具 能 够 识别 代码 中 的 乘法 操作 符 “* ”， 并 且 将 其 转换 为 相应 
的 乘法 器 硬件 。 

有 些 EDA 综合 工具 还 能 识别 代码 中 的 乘 法 累加 操作 和 乘 加 操作 表达 式 ， 将 
其 转换 为 专用 的 DSP 块 ， 实 现 相 同 算 术 的 功能 。 

此 外 ， 有 些 综合 工具 还 可 以 将 输入 /输出 寄存 噩 映射 到 DSP 块 以 压缩 使 用 的 
寄存 器 数量 ， 提 高 性 能 和 面积 的 使 用 率 。 

然而 ，DSP 模块 有 一 些 更 高 级 的 功能 ， 例 如 高 度 流水 线 模式 〈high pipeline 
modes) ， 只 有 通过 厂商 提供 的 原 语 才 能 使 用 ， 而 且 必 须 采用 实例 引用 该 模块 的 
方法 才 行 ， 不 能 通过 综合 从 代码 的 算术 表达 式 转 换 实现 。 

图 8-22 详细 地 展示 了 一 段 执行 乘 累 加 操作 的 代码 ， 毕 合 后 将 用 专用 的 DSP 
块 实现 。 

寄存 带 

FPGA 综合 工具 从 同一 个 基本 的 if-else 模板 推 采 得 到 寄存 器 。 

在 Verilog 语言 中 ， 异步 ( 触 发) 条 件 与 来 自 异 步 控制 的 时 钟 是 有 区 别 的 ， 
见 图 8-23 所 示 。 

在 VHDL 语言 中 , 用 rising_ edge () 来 表示 时 钟 信 号 ， 如 图 8-24 所 示 。 

设计 师 必须 首先 指定 所 有 的 异步 条 件 ， 异 步 条 件 的 优先 权 高 于 同步 条 件 。 

寄存 器 的 二 级 控制 信号 

再 重复 说 明 一 下 ， 必 须 理解 目标 硬件 。 

在 有 些 技术 中 ，FPGA 融 件 中 的 寄存 器 只 支持 异步 清 零 ， 只 有 复位 信号 从 高 
电 平 接 到 地 才 可 以 清 零 ， 并 且 不 支持 异步 加 载 。 
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assign multa = dataa_reg*datab_reg; 


assign adder_out = multa_reg+dataout; 


always @ (posedge clk or posedge aclr) 
begin 
if (aclr) 
begin 
dataa reg <= 0; 
datab reg <= 0; 
multa_reg <= 0; 
dataout <= 0; 
end 
else if (clken) 
begin 
dataa_reg <= dataa; 
datab_reg <= datab; 
multa_reg <= multa; 
dataout <= addr_out; 
end 


end 


图 8-22 ” 乘 累 加 操作 


always (@ (posedge clk or negedge rst) if (rst= “0’) then 


begin q <= ‘0’; 
if (~rst) q <= 1 b0; elseif (rising edge (clk)) then 
else q <= data; q <= data; 


end end if ; 


图 8-23 用 Verilog 描述 的 寄存 器 的 示例 图 8-24 用 VHDL 描述 的 寄存 器 示 仿 


| 


不 支持 异步 加 载 的 寄存 器 很 容易 产生 竞争 冒险 ， 这 点 和 锁 存 器 及 组 合 逻 辑 类 
似 。 

使 用 寄存 咒 的 二 级 控制 信号 也 会 影响 布局 布线 。 许 多 FPCA 器 件 对 可 使 用 的 
二 级 控制 资源 的 数量 有 限制 。 以 Altera 的 Stratix 结构 为 例 由 于 时 钟 使 能 
(ena) 、 同 步 清 零 (sclr) 、 同 步 置 数 〈sload) 被 同一 个 LAB 中 的 所 有 逻辑 单元 
共享 ， 所 以 如 果 单 个 LAB 范围 内 有 太 多 的 控制 信号 ， 将 会 影响 设计 的 逻辑 资源 
使 用 率 ( 见 图 8-25)。 
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条 件 语句 

使 用 恋 套 的 if-else 条 件 语句 综合 后 生成 的 是 具有 固定 优先 级 的 2 选 1 多 路 骨 
树 。 这 种 编码 风格 让 设计 师 可 以 控制 晚 到 的 信号 ， 如 图 8-26 所 示 ， 这 里 “a” 是 
晚 到 的 信号 。 


er 1. 异步 清 零 (acln if (condl) then et 
同 2 预 置 (pre) 和 
3. 异步 置 数 (aload) elseif (cond2) then cond2 
4. 使 能 (ena) 0 <=b; a 
5. 同步 清 零 (sclr) Ise 
6. 同步 置 数 (sload) 2 3 A condl 
低 7 数据 输入 (data) < 
图 8-25 ”寄存 器 二 级 控制 信号 图 8-26 多 路 器 
综合 的 优先 级 顺序 


综合 上 述 风 格 的 代码 可 以 得 到 多 路 器 ， 但 务必 注意 ， 当 散 套 层次 太 多 时 ,会 
显著 地 增加 电路 的 延 时 。 

如 果 条 件 是 互 斥 的 ， 建 议 使 用 case 语句 编写 代码 。 综 合 后 可 以 生成 N 选 1 
多 路 器 ( 见 图 8-27 ) 。 

这 种 类 型 的 多 路 器 比较 容易 优化 , 并 且 比 功能 相同 有 先后 次 序 的 多 路 器 的 延 
述 短 得 多 。 


=a: 
=b; 
=C: 
=d; 


sel 


图 827 N 选 1 多 路 顺 


8.6 RTL 设计 的 分 析 


所 有 FPGA 综合 工具 都 有 一 套 报告 设计 是 否 达 到 性 能 指标 的 工具 。 这 些 报告 
还 有 一 个 好 处 ， 即 提供 设计 架构 的 细节 ， 这 对 设计 师 理 解 不 是 由 自己 创建 的 设计 
模块 很 有 帮助 。 
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8.6.1 综合 报告 


所 有 的 综合 工具 都 能 生成 详细 记录 设计 关键 信息 的 报告 文件 。 
8.6.1.1 源 文件 

综合 报告 会 详细 地 列 出 设计 项 目 中 哪些 源 文件 和 库 已 被 综合 成 网 表 。 这 对 确 
保 综合 器 使 用 的 源 文件 版 本 的 正确 性 至 关 重 要 。 
8. 6. 1.2 综合 设置 

综合 报告 会 详细 地 列 出 综合 工具 在 这 次 综合 中 所 使 用 的 综合 设置 选项 。 该 信 
息 对 再 现 综合 结果 至 关 重 要 ， 应 该 包含 在 设计 文件 中 。 
8. 6.1.3 资源 使 用 信息 

综合 报告 通常 按 层次 列 出 关于 资源 使 用 的 信息 。 该 信息 对 于 找到 设计 中 消耗 
大 量 FPGA 资源 的 区 域 非常 有 用 。 资 源 使 用 信息 也 有 助 于 发 现 那 些 不 想 优化 却 被 
优化 掉 逻 辑 的 位 置 以 及 实现 的 设计 与 设计 师 本 意 不 一 致 的 地 方 。 例 如 ， 综 合 报 告 
显示 实现 乘法 操作 使 用 的 是 查找 表 (LUT) 而 不 是 专用 的 DSP 块 。 
8.6.1.4 状态 机 

在 大 多 数 的 综合 报告 中 专门 有 一 小 节 列 出 设计 中 已 被 识别 的 所 有 状态 机 ， 其 
中 包括 状态 机 编码 的 详细 信息 。 该 信息 有 助 于 发 现 由 编码 风格 而 导致 违背 设计 师 
意图 的 状态 编码 ， 也 有 助 于 发 现 未 被 识别 的 状态 机 。 这 些 情况 会 导致 非 最 优 的 实 
现 ， 并 会 影响 设计 的 调试 。 
8.6.1.5 优化 信息 

综合 报告 中 还 包含 对 设计 的 哪些 地 方 已 执行 优化 的 信息 。 对 寄存 器 而 言 ， 通 
稼 是 某 些 寄存 器 已 被 优化 掉 或 被 复制 的 信息 。 在 有 些 综合 工具 中 会 解释 进行 优化 
的 原因 ， 如 寄存 器 由 于 没有 书 出 而 被 优化 掉 ， 或 者 通过 寄存 器 复制 来 减少 它 的 鹿 
出 。 这 部 分 报告 还 包含 连接 信息 ， 诸 如 模块 的 输入 端口 或 寄存 器 的 输入 与 地 连 
接 。 这 有 助 于 发 现 RTL 代码 中 可 能 出 现 的 错误 ， 而 且 对 发 现 结构 化 代码 连接 中 
的 问题 特别 有 用 。 
8. 6.1.6 时 序 估 计 

如 前 所 述 ， 综 合 得 到 的 时 序 估计 并 不 准确 ， 应 该 被 视 为 粗略 的 估计 。 最 好 能 
执行 布局 布线 操作 ， 以 获得 对 设计 或 子 设计 时 序 的 更 准确 估计 。 


8.6.2 综合 警告 


设计 师 应 该 认真 核查 综合 引擎 产生 的 所 有 警告 ， 以 确保 设计 正确 无 误 。 
综合 工具 能 生成 大 量 严重 程度 不 同 的 警告 。 
设计 师 应 该 修改 代码 或 者 修改 综合 选项 来 消除 所 有 的 警告 。 如 果 该 警告 不 能 
避免 设计 师 要 完全 理解 产生 该 警告 的 原因 ， 并 且 要 核实 这 里 是 否 真 的 存在 问 
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题 ， 然 后 在 模块 的 文档 中 加 以 说 明 。 大 多 数 综合 工具 提供 核查 这 些 警 告 并 且 在 后 
序 的 编译 中 抑制 这 些 警 告 的 能 力 。 这 将 大 大 简化 后 序 编译 的 核查 过 程 。 
然而 ， 建 议 设计 者 在 最 终 设计 签收 之 前 ， 完 成 对 全 部 警告 的 核查 。 


8.6.3 电路 方块 图 的 浏览 


大 多 数 EDA 综合 工具 有 电路 图 浏览 器 选项 ， 可 以 用 于 设计 分 析 。 浏 览 器 可 
以 为 设计 创建 电路 方块 图 并 能 提供 快速 调试 RTL 代码 的 能 力 。 在 大 多 数 情况 下 ， 
为 了 方便 信号 的 跟踪 和 设计 代码 的 调试 ， 这 些 电 路 框图 和 HDL 源 代码 之 间 可 以 
互相 切换 ， 交 叉 探测 。 

对 于 那些 不 是 由 设计 师 本 人 创建 ， 而 是 从 其 他 设计 师 那里 重用 的 RTL 代码 ， 
这 些 工 具 对 增进 这 些 重用 的 RTL 代码 的 理解 非常 有 帮助 。 它 能 快速 显示 设计 的 
结构 和 设计 的 数据 流 。 

图 8-28 展示 了 用 QuartusT1” 软 件 中 的 RTL 浏览 器 看 到 的 电路 图 。 


LE Tk 
I 回 日 和 中 | 卫队 1 向 3 
1 |“ 


图 8-28 Quartus 开 的 RIL 浏览 


70 . FPGA 设计 : 基于 团队 的 最 佳 实践 


用 RTL 浏览 器 可 以 很 容易 地 观察 到 状态 机 的 设计 ， 而 且 可 以 很 容易 地 确定 
综合 后 产生 的 电路 是 否 符合 设计 师 的 期 望 。 
由 Quartus Ge 


图 8-29 Quartus 开 状态 机 浏览 


8.7 RTL 设计 要 点 总 结 


选择 一 种 硬件 描述 (HDL) 语言 ; 

. 选择 EDA 综合 工具 ; 

. 熟悉 所 要 使 用 的 FPGA 器 件 的 性 能 ; 

. 创建 一 个 概要 的 系统 设计 ; 

. 遵循 所 推荐 的 HDL 编码 指导 原则 ; 

. 分 割 设计 模块 ， 并 逐一 实现 ; 

.确定 每 个 设计 模块 的 指标 ， 即 速度 、 功 耗 和 面积 ; 
.逐个 编译 设计 模块 ， 进 行 面 积 和 性 能 的 估计 ; 
.对 每 个 模块 进行 仿真 ; 

10 为 每 个 模块 创建 一 个 文档 ; 


te 
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11. 
]2， 
13. 
14. 
15. 
16. 
17. 


消除 综合 报告 中 的 警告 ; 

组 合 多 个 模块 合并 成 为 一 个 完整 的 工程 ; 
完成 整个 设计 的 仿真 ; 

分 析 完 整 设 计 的 综合 报告 ; 

消除 完整 设计 的 警告 ; 

完成 整个 设计 的 文档 ; 

对 整个 设计 进行 时 序 收敛 工作 。 


第 9 章 也 及 设计 重用 


9.1 引言 


本 书 的 主要 目的 是 指导 设计 师 如 何 编写 可 在 FPGA 器 件 中 重用 的 设计 模块 ， 
阐述 的 主题 从 编写 设计 规范 起 ， 一 直到 RTL 代码 的 编写 和 设计 验证 的 整个 过 程 。 
本 章 关于 IP 重用 的 论述 和 其 他 章节 的 内 容 是 互补 的 。 这 里 着 重 于 讲述 IP 重用 的 
好 处 ， 如 何 决定 是 由 自己 设计 卫 ， 还 是 外 购 PP， 以 及 如 何 对 卫 进行 封装 以 方便 
使 用 。 


9.2 JP 重用 的 需求 


工业 界 普 遍 认同 P 重用 能 减少 工程 量 ， 因 此 能 加 快 产品 的 上 市 时 间 ， 从 而 
降低 开发 费用 。 

众所周知 ， 很 多 新 产品 的 设计 是 在 老 产 品 的 基础 上 发 展 而 来 的 ， 这 实际 上 就 
是 设计 的 重用 。 在 大 多 数 情况 下 ， 新 产品 会 在 老 产 品 的 基础 上 增加 一 些 新 的 功 
能 ， 而 老 产 品 的 设计 在 新 产品 的 设计 中 被 作为 一 个 整体 加 以 利用 。 

然而 ， 当 需要 设计 一 个 全 新 的 产品 或 者 由 其 他 设计 小 组 设计 别 的 产品 时 ， 设 
计 的 重用 并 不 普遍 。 

然而 ， 在 实际 工作 中 ， 设 计 模 块 却 完全 可 以 被 别 的 小 组 用 在 其 他 产品 的 设计 
中 。 

但 是 ， 为 什么 设计 的 重用 依然 不 多 见 呢 ? 

主要 原因 是 大 多 数 公 司 还 没有 采纳 已 被 开发 机 构 普 遍 认可 的 设计 可 重用 方法 
学 。 

模块 设计 工程 师 通 常 不 会 主动 地 在 公司 内 部 推广 设计 可 重用 方法 学 。 但 他 们 
会 是 设计 可 重用 方法 学 的 使 用 者 和 贡献 者 。 

因此 ， 工 程 管理 部 门 有 责任 从 高 层 推广 设计 可 重用 方法 学 。 


9.2.1 IP 重用 的 好 处 


采用 设计 重用 方法 学 主要 有 以 下 五 个 好 处: 
1. 可 充分 利用 现 有 的 投资 。 每 个 小 组 都 在 做 自己 的 设计 ， 而 这 些 设计 的 功 
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能 通常 基本 相同 ， 这 样 做 显然 浪费 人 力 。 如 果 能 在 很 多 个 设计 中 重复 利用 功能 相 
同 的 模块 ， 就 可 以 充分 地 利用 原始 设计 的 投资 。 

2. 可 获得 预期 的 结果 。 因 为 现成 模块 的 性 能 是 已 知 的 ， 所 以 使 用 现成 模块 
做 设计 ， 可 减少 不 合格 设计 的 数量 。 当 设计 模块 用 另 一 种 FPGA 技术 实现 时 ， 如 
果 模 块 代码 是 遵循 第 8 章 建议 的 RTL 编码 规则 编写 的 ， 那 么 在 新 技术 中 编译 该 
模块 并 快速 评估 其 性 能 就 比较 容易 。 这 比 从 头 开始 编写 和 验证 新 的 RTL 设计 要 
快 得 多 。 

3. 使 工程 师 能 集中 精力 发 挥 自己 的 核心 能 力 。 设 计 中 的 某 些 元 件 可 能 不 是 
设计 师 本 人 精通 的 领域 。 知 能 利用 该 领域 专家 设计 的 模块 ， 则 设计 师 就 可 以 致力 
于 他 自己 的 专长 。 例 如 ， 包 处 理 设计 中 数据 通过 以 太 网 接口 传输 到 芯片 上 。 设 计 
工程 师 可 能 是 一 个 包 处 理 专家 ， 但 并 不 擅长 开发 以 太 网 接口 。 通 过 重用 已 有 的 
10G 以 太 网 接口 模块 ， 设 计 师 就 能 把 精力 集中 在 实现 包 处 理 功 能 的 核心 技术 上 。 

4. 可 以 最 大 程度 地 缩短 验证 周期 。 因 为 重用 的 设计 模块 以 前 早 就 被 验证 过 ， 
所 以 只 需要 作为 整个 系统 验证 的 一 部 分 ， 对 它们 做 再 次 验证 。 

5. 可 以 更 快 地 投入 市 场 。 将 现成 的 设计 模块 添加 到 系统 中 可 能 只 需要 几 个 
小 时 的 操作 ， 而 编写 复杂 的 功能 模块 〈 如 Interlaken 或 DDR3 存储 器 等 接口 模 
块 ) 并 实现 可 能 要 花 上 几 个 月 的 时 间 。 


9.2.2 开发 可 重用 设计 方法 学 面临 的 困难 


设计 重用 不 是 唾 手 可 得 的 ， 需 要 一 定 的 投入 。 采 用 设计 重用 技术 ， 无 论 在 成 
本 和 设计 效率 方面 都 能 产生 巨大 的 经 济 效益 ， 然 而 ， 公 司 中 每 个 工程 部 门 在 思维 
习惯 上 必须 有 一 个 重大 的 转变 。 
9.2.2.1 工程 师 的 思维 习惯 

设计 重用 面临 的 第 一 个 挑战 是 让 工程 师 们 在 思维 习惯 上 做 角色 的 转换 ， 把 自 
己 从 模块 设计 师 转变 为 现成 模块 的 使 用 者 。 很 多 公司 都 患 有 “ 非 本 公司 创造 综 
合 症 (Not-Invented-Here，( NIH) syndrome)”。 换 言 之 ， 公 司 中 有 些 工 程 师 认 为 
若 在 设计 中 利用 了 别人 编写 的 成 熟 模块 ， 是 很 没有 面子 的 ， 降 低 了 自己 的 人 格 和 
创造 的 价值 。 他 们 希望 创建 自己 的 设计 而 不 是 使 用 别人 的 代码 。 

此 外 ， 有些 设计 师 在 创建 模块 时 ,他们 往往 想 把 这 些 模块 作为 自己 的 知识 产 
权 。 他 们 认为 与 别人 分 享 设计 模块 也 许 会 减少 自己 对 该 模块 的 所 有 权 。 他 们 也 可 
能 担心 当 其 他 设计 师 重 用 他 们 设计 的 模块 时 ， 会 批评 他 们 的 设计 。 
事实 上 ， 最 大 的 障碍 在 于 使 设计 模块 能 够 重用 需要 投入 极 大 的 努力 ， 而 公司 
方面 ， 却 没有 给 工程 师 们 留 足 够 多 的 时 间 做 这 些 繁 杂 的 工作 ， 工 程 师 们 也 不 愿意 
花 自 己 的 功夫 为 他 人 作 嫁 衣 。 

公司 通过 建立 正式 的 开发 规范 来 解决 面临 的 难题 。 接 受 规范 的 最 初 阵痛 过 去 
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后 ， 遵 守 规 范 就 会 成 为 工程 师 们 的 一 种 生活 方式 ， 进 而 他 们 将 会 以 创建 可 重用 的 
设计 模块 为 骄傲 ， 就 像 他 们 现在 创建 自己 的 设计 一 样 。 
9.2.2.2 可 重用 设计 模块 的 推广 

推广 IP 是 一 个 难题 。 工 程 师 们 需要 知道 到 哪 去 找 可 能 对 他 们 设计 有 用 的 模 
块 。IP 模块 的 使 用 者 需要 有 能 力 找到 有 关 该 IP 性 能 指标 的 说 明 书 ， 以 及 如 何 使 
用 和 验证 该 IP 的 资料 。 这 将 消除 他 们 对 设计 质量 的 所 有 顾虑 。 

同样 ， 工 程 师 们 需要 知道 如 何 发 布 自己 设计 的 IP; 在 这 里 发 布 的 意思 是 指 
如 何 使 自己 设计 的 IP 核 为 其 他 使 用 者 所 知晓 。 

对 采用 IP 重用 方法 学 而 言 ，IP 的 推广 和 确认 可 能 是 最 大 障碍 。 由 于 IP 的 使 
用 者 没有 直接 接触 该 耻 原来 的 设计 过 程 ， 他 们 需要 很 多 有 关 的 信息 与 该 IP 封装 
在 一 起 。 这 些 信息 包含 文档 、 验 证 计划 和 测试 等 。 

这 些 问 题 可 以 通过 一 个 普通 的 管理 设计 重用 的 网 站 (例如 与 版 本 控制 软件 
关联 的 维基 或 SharePoint 网 站 ) 来 解决 。 
9.2.2.3 开发 工作 

设计 重用 往往 需要 花费 很 长 的 时 间 ， 并 付出 极 大 的 努力 ， 因 此 可 重用 模块 的 
开发 代价 远 高 于 某 个 项 目 中 一 次 性 使 用 的 模块 。 项 目 进度 计划 是 决定 某 个 模块 是 
否 应 该 进行 可 重用 设计 的 一 个 因素 。 为 确保 所 有 项 目的 进度 ， 重 视 设 计 可 重用 性 
的 公司 需要 确保 所 有 项 目的 进度 计划 均 允 许 关 键 模 块 被 设计 成 为 可 重用 的 模块 。 
这 样 做 ， 未 来 的 设计 效率 将 会 有 更 大 的 提高 。 
并 非 每 个 设计 组 件 都 需要 重用 ， 因 此 避免 不 必要 的 重用 设计 至 关 重 要 。 

确定 哪些 模块 需要 做 可 重用 设计 是 一 项 很 困难 的 工作 。 清 晰 地 界定 在 不 同 应 
用 环境 下 都 能 顺利 地 重用 的 模块 并 非 易 事 。 

因此 ， 在 编写 模块 设计 说 明 书 时 ， 有 必要 关联 公司 内 部 的 其 他 产品 和 应 用 ， 
理解 该 模块 的 功能 。 这 些 信 息 可 以 被 用 来 决定 该 模块 是 否 应 该 按 可 重用 方式 进行 
设计 ， 在 模块 设计 说 明 书 中 对 此 应 该 有 明确 的 表述 。 

某 些 小 模块 〈 如 地 址 解码 器 和 仲裁 器 ) 的 设计 ， 最 好 让 系统 集成 工具 来 完 
成 。 

同样 ， 如 果 想 要 设计 一 个 模块 ， 其 功能 与 时 序 的 关系 非常 密切 ， 对 速度 性 能 
的 要 求 又 十 分 苛刻 , 那么 很 可 能 在 其 他 FPGA 器 件 系 列 上 ， 甚 至 同系 列 的 其 他 
FPGA 器 件 上 都 不 能 实现 该 设计 的 重用 。 所 以 ， 对 该 模块 只 能 做 一 次 性 的 设计 ， 
并 不 需要 遵循 所 有 的 设计 重用 建议 。 


9.3 设计 还 是 购买 


每 当 需 要 开发 下 时， 工程 经 理 们 总 会 遇 到 这 样 一 个 问题 : 究竟 在 公司 内 部 
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自己 开发 好 还 是 到 外 面 购买 好 呢 ? 

IP 对 满足 设计 整体 性 的 需求 是 否 十 分 关键 是 决定 自行 设计 IP 的 重要 因素 之 
一 。 自 行 开发 的 设计 模块 能 更 好 地 控制 设计 的 优化 ， 更 能 满足 未 来 的 特殊 需求 。 
如 果 考 虑 到 这 些 ， 设 计 师 就 应 该 考虑 自行 设计 。 当 然 如 果 能 得 到 源 代码 ， 也 可 以 
利用 其 他 小 组 已 经 开发 的 设计 模块 。 

同样 ， 如 果 该 卫 模块 是 使 您 的 产品 在 竞争 中 脱颖而出 的 特色 之 一 ， 您 肯定 
有 强烈 的 愿望 想 彻 底 理 解 RTL 代码 的 功能 并 拥有 该 IP 源 代码 的 知识 产权 。 

考虑 IP 是 自行 开发 还 是 外 购 的 男 一 个 因素 是 成 本 。 设 计 者 需要 知道 自行 开 
发 该 卫 和 验证 其 功能 的 成 本 ， 并 与 外 购 的 现成 解决 方案 做 对 比 。 

然而 产品 的 上 市 时 间 可 能 会 迫使 设计 者 去 购买 耻 。 如 果 设 计 进 度 紧 迫 ， 且 
已 有 的 资源 已 被 完全 利用 ， 购 买 IP 也 许可 以 节约 几 个 月 的 开发 时 间 。 

目标 FPGA 技术 的 IP 可 用 性 是 另外 一 个 需要 考虑 之 处 。 从 FPGA 系列 的 新 
成 员 面市 起 到 能 在 这 个 新 器 件 上 运行 的 下 出 现 之 前 ， 通 常 需要 一 段 时 间 。 很 多 
小 型 FPGA 厂商 都 会 等 待 主要 用 户 先 去 测试 这 些 PP。 这 会 导致 时 序 要 求 高 的 IP 
在 可 用 性 上 有 一 个 延迟 。 第 一 个 使 用 新 IP 的 用 户 可 能 成 为 新 技术 下 验证 IP 的 试 
验 者 ， 对 这 个 用 户 来 说 会 有 一 定 的 风险 。 当 然 在 领先 技术 中 率先 使 用 该 PP 也 会 
有 好 处 ， 设 计 者 可 能 会 在 竞争 中 拔 得 头筹 。 

每 当 设计 者 从 其 他 资源 中 获得 设计 模块 时 ， 总 会 担心 该 设计 模块 的 质量 ， 特 
是 在 购买 IP 的 时 候 。 

目前 还 没有 关于 IP 质量 的 产业 标准 可 以 帮助 设计 者 选择 IP。 过 去 有 过 一 些 
倡议 ， 但 都 未 达到 能 被 业界 认可 和 采纳 的 程度 。 因 此 设计 者 需要 依赖 于 IP 供应 
商 的 声誉 ， 或 者 详细 询问 IP 供应 商 的 验证 过 程 及 想 要 购买 的 卫 的 运行 效果 来 选 
择 了 。 

究竟 自己 开发 模块 省 钱 ， 还 是 外 购 模 块 省 钱 ， 设 计 者 可 以 根据 上 面 列 出 的 所 
有 情况 做 一 个 比较 。 

奉 设 计 小 组 对 所 需 的 功能 领域 并 不 了 解 ， 也 没有 什么 经 验 ， 则 应 该 当机立断 
购买 IP。 


器 


力 


< 


9.4 构建 可 重用 的 IP 


9.4.1 设计 说 明 书 
首先 ， 在 整个 系统 的 设计 说 明 书 中 应 该 明确 指出 哪 几 个 新 模块 是 待 开发 的 并 
可 以 被 用 于 其 他 设计 。 这 将 会 影响 这 几 个 模块 开发 计划 和 技术 说 明 书 的 编写 。 
因此 ， 设 计 说 明 书 中 必须 把 这 几 个 模块 明确 定义 为 可 重用 模块 ， 并 应 遵循 
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IP 可 重用 设计 的 指导 原则 进行 设计 。 

当 这 些 可 重用 模块 的 设计 说 明 书 被 审核 时 ， 应 当 包 含 可 能 使 用 这 些 IP 的 其 
他 小 组 的 审核 意见 。 这 样 做 有 三 个 主要 目的 。 首 先 增加 各 个 小 组 对 该 IP 的 认识 
程度 。 其 次 ， 在 编写 技术 说 明 书 阶段 就 使 其 他 设计 小 组 参与 进来 ， 他 们 在 该 下 
中 就 会 有 既得 利益 ， 从 而 会 更 愿意 在 自己 的 设计 中 采用 这 些 IP 模块 。 最 后 ， 其 


9.4.2 实施 方法 


9. 4.2.1 参数 化 RTL 代码 


他 设计 小 组 可 能 会 提供 一 些 被 设计 者 自身 忽略 的 反馈 意见 。 


使 用 参数 化 的 RTL 代码 是 业界 最 常见 的 IP 开发 方法 。 它 是 创建 和 维护 可 重 


FIFO 的 数据 位 宽 。 

由 于 参数 可 以 传递 不 同 的 常 
量 ， 所 以 参数 化 模块 可 以 为 设计 
提供 内 置 的 灵活 性 ; 在 Verilog 语 
中 的 参 数 是 parameters ; 在 
VHDL 语言 中 的 参数 是 generics 。 

在 决定 将 卫 的 哪 几 个 常量 变 
成 可 变 参 数 时 ， 设 计 者 应 该 考虑 
该 卫 核 的 可 能 用 途 、 期 望 的 功能 
变化 范围 ， 从 而 为 每 个 想 要 的 功 
能 设置 相应 的 配置 参数 。 

在 Verilog 和 VHDL 中 都 有 生 
成 语句 可 用 ， 生 成 语句 与 可 重用 
IP 中 的 参数 互相 配合 ， 可 以 生成 
复杂 的 实例 ， 有 效 地 实现 IP 的 重 
用 。 生 成 的 实例 和 模块 参数 可 以 
被 用 于 消除 元 余 的 逻辑 ， 从 而 创 
建 灵活 的 设计 。 

用 “for” 循 环 构成 的 生成 循 


用 模块 的 最 简单 方法 。 下 面 举 几 个 例子 ， 说 明 如 何 使 用 参数 来 设置 存储 器 和 


module bus_mux (din,sel,dout); 


parameter DAT_WIDTH = 16; 

parameter SEL_WIDTH = 3; 

parameter TOTAL_DAT=DAT_WIDTH <<SEL_WIDTHL 
parameter NUM_WORDS =(] <<SEL_WIDTH); 


input [TOTAL DAT 11:0] din; 
input [SEL_WIDTH-1:0] sel; 
output [DAT_ WIDTH-1:0] dout; 


genvar Lk; 
generate 
for (k=0;k <DAT WIDTH;k = k+l1) 
begin : out 
wire [NUM_ WORDS 1:0] tmp; 
for (i= 0;i<NUM WORDS; 1=1+1) 
begin : mx 
assign tmp [1] = din[k+i*DAT_WIDTHI]; 
end 
assign dout[k] =tmp[sel]， 
end 
endgenerate 
endmodule 


图 9-1 Verilog 源 文件 中 参数 使 用 的 细节 


环 可 以 包括 多 条 语句 也 可 以 实例 引用 多 个 块 。 
生成 语句 可 以 用 来 创建 参数 化 逻辑 。 图 9-1 展示 了 一 个 使 用 带 参 数 的 生成 语 


句 来 产生 总 线 多 路 器 的 例子 。 


在 第 8 章 RTL 设计 中 ， 可 以 找到 针对 可 重用 IP 如 何 编写 其 RTL 代码 的 更 详 


细 的 指导 原则 。 
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第 8 章 的 第 8.5.2.3 节 中 提供 设计 分 层 和 分 区 的 指南 。 第 8. 5. 2. 4 节 则 提供 
了 针对 设计 重用 的 编码 指南 。 
9.4.2.2 高 层次 综合 

高 层次 综合 对 算法 探索 非常 有 效 ， 特 别 在 使 用 Ansi CAC + + 作为 设计 输入 
的 数字 信号 处 理 领域 更 是 如 此 。 这 一 类 工具 可 以 大 幅度 地 减少 编写 RTL 算法 代 
码 的 时 间 ， 从 而 为 软件 或 系统 工程 师 等 新 人 进入 硬件 设计 行业 开启 大 门 。 当 算法 
描述 与 算法 模型 非常 接近 或 完全 一 致 时 ， 这 些 工 具 在 算法 设计 的 架构 探索 阶段 表 
现 杰 出 。 由 于 描述 功能 所 需 的 “C ”代码 行 数 远 比 描述 硬件 实现 的 RIL 代码 的 
行 数 少 得 多 ; 因此 设计 效率 有 显著 提高 。 这 些 工 具 也 能 为 把 设计 移植 到 不 同 FP- 
GA 系列 的 器 件 上 提供 更 多 的 灵活 性 。 在 设计 的 最 高 层次 上 ， 代 码 并 非 是 为 某 一 
种 目标 FPGA 器 件 而 编写 的 。 

然而 ， 对 精心 调整 优化 的 质量 结果 ( Quality of Results ，QoR) 而 言 ， 通 过 高 
层次 综合 工具 得 到 的 解决 方案 往往 不 是 最 佳 的 解决 方案 ， 这 是 它们 的 主要 缺点 。 
综合 后 的 面积 效率 不 高 ， 或 有 些 性 能 不 能 达标 。 近 年 来 ， 在 某 些 类 别 DSP 应 用 
中 ， 这 些 工 具 在 结果 质量 (QoR) 方面 取得 了 良好 的 进展 。 总 而 言 之 ， 在 创建 性 
能 要 求 不 高 的 DSP IP 时 可 以 考虑 使 用 这 些 工具 。 

除了 CLC ++ 工 具 外 ， 还 有 男 一 类 基于 模型 的 设计 工具 。 这 些 工 具 通 过 Simu- 
link 提供 与 MATLAB 环境 的 接口 。 同 样 ， 这 些 工具 大 多 针对 DSP 应 用 。 它 们 已 
在 一 个 较 小 的 应 用 领域 中 取得 了 成 功 ， 大 多 数 是 在 调制 解 调 器 设计 和 一 些 军事 领 
域 的 应 用 。 换 句 话 说， 在 这 些 应 用 领域 中 创建 耻 时， 可 以 考虑 使 用 这 类 工具 。 
9.4.2.3 卫生 成 器 

卫生 成 器 使 用 C + + 、Perl 或 者 其 他 高 级 语言 编写 而 成 ， 根 据 终端 用 户 的 参 
数 设置 来 动态 地 生成 RTL 代码 。 这 些 生成 器 可 根据 所 选 的 参数 把 几 个 RTL 设计 
模块 的 整合 在 一 起 。 

FPCA 厂商 常用 这 种 技术 为 他 们 的 客户 群 提供 复杂 的 IP。 

IP 生成 器 解析 用 户 指定 的 所 有 参数 ， 根 据 设计 说 明 书 生成 HDL 代码 。 

它们 适合 用 于 复杂 的 参数 组 合 ， 复 杂 的 合法 性 检查 和 高 级 的 算术 运算 处 理 。 

卫生 成 器 的 缺点 在 于 必须 具有 软件 编程 技能 才能 用 它 生 成 卫 。 


9.4.3 标准 接口 的 使 用 


建议 所 有 的 IP 采 用 通用 的 标准 接口 。 使 用 标准 接口 可 以 简化 设计 的 构造 ， 
便于 功能 模块 的 互联 和 管理 。 使 用 IP 标准 接口 有 以 下 六 个 好 处 : 

1. 确保 由 不 同 设计 小 组 或 厂商 设 计 的 IP 组 件 的 兼容 性 。 

2. 可 以 很 快 地 把 多 个 IP 组 成 完整 的 系统 。 由 于 IP 的 使 用 者 知道 接口 信号 是 
如 何 操 作 的 ， 所 以 与 设计 模块 的 接口 逻辑 可 显著 地 简化 。 
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3. 为 系统 整合 开启 了 使 用 设计 自动 化 工具 的 大 门 。 

4. 由 于 设计 团队 的 个 别 成 员 就 能 编写 并 测试 他 们 自己 设计 的 模块 ， 采用 标 
准 接口 使 基于 团队 的 设计 变 得 简单 方便 。 通 过 对 和 常用 接口 协议 的 理解 ， 每 个 团队 
成 员 都 知道 如 何 与 常用 标准 接口 模块 连接 。 因 此 ， 把 多 个 设计 模块 组 成 完整 的 系 
统 变 得 十 分 简便 。 

5. 标准 接口 使 得 IP 能 即 插 即 用 。 

6. 标准 接口 使 IP 的 稳定 性 得 以 提高 。 接 口 协议 说 明 书 详细 地 描述 了 接口 信 
号 的 操作 ， 而 且 IP 核 的 接口 信号 可 对 照 说 明 书 进行 操作 和 验证 。 

如 今 市 面 上 有 各 种 标准 的 接口 。 在 FPGA 和 ASIC 设计 中 采用 最 广泛 的 接口 
标准 是 ARM 公司 的 AMBA (AXI，AHB 和 APB) ，Altera 公司 的 Avalon (MM 和 
ST) ，OCP-IP 公司 的 OCP 和 OpenCores 公司 的 Wishbone。 

选择 标准 的 接口 协议 时 ， 设 计 师 必须 确保 该 IP 的 基本 结构 可 以 植 人 作为 设 
计 目 标的 FPCA 中 。 这 里 所 提 及 的 卫 基本 结构 指 的 是 在 目标 FPCA 的 组 件 库 中 
设计 师 可 以 找到 该 卫 的 组 件 模块 ， 该 P 必须 符合 设计 所 要 求 的 标准 接口 协议 ， 
而 且 关 于 该 协议 的 说 明 书 是 确实 可 靠 的 。 卫 应 该 包含 两 个 部 分 : 

1) 可 综合 为 最 终 设计 的 电路 结构 部 分 ; 

2) 验证 该 IP 的 测试 模型 ， 如 总 线 功能 模型 。 

标准 接口 必须 容易 理解 ， 简 明 扼要 ， 标 准 接口 在 硬件 实现 时 不 应 该 产生 性 能 
和 面积 的 损失 。 该 标准 接口 必须 支持 设计 者 所 有 的 应 用 需求 。 这 通常 包括 基于 地 
址 读 / 写 的 存储 器 映射 接口 ， 典 型 的 接口 有 主 从 连接 接口 ， 支 持 单 向 数据 流 的 点 
对 点 接口 ， 包 括 多 路 选择 的 流 、 包 和 DSP 数据 。 

总 而 言 之 ,使 用 标准 接口 协议 确实 是 设计 可 重用 策略 的 核心 。 


9.5 ”IP 组 件 库 软件 包 


IP 组 件 库 软件 包 是 FPGA 开发 环境 中 的 一 个 实用 工具 箱 ， 其 中 包括 由 许多 
IP 核 构成 的 组 件 库 ， 以 及 选用 和 配置 这 些 IP 组 件 的 配套 工具 。 

好 的 卫 组 件 软件 包 应 该 使 设计 者 垂 手 即 可 取得 工具 箱 中 的 每 个 工具 ， 很 容 
易 找 到 想 要 的 IP 组 件 ， 安 装 和 维护 每 个 IP 组 件 应 该 非常 容易 。 

设计 师 可 以 从 公司 的 可 重用 卫 库 中 找到 所 需 的 卫 ， 或 者 从 用 户 工 作 站 或 设 
计 环 境 中 发 起 安装 某 IP 组件 的 请 求 。 若 某 IP 组 件 需要 安装 ， 则 建议 设计 师 通 过 
现成 的 商业 工具 来 完成 该 IP 组 件 的 安装 ,例如 通过 IP 安装 界面 ， 也 可 以 用 
WinZip 或 类 似 的 程序 创建 一 个 自 解压 的 可 执行 文件 来 完成 组件 的 安装 。 

一 个 IP 组 件 包 的 最 低 要 求 如 下 : 

1. IP 核 ， 即 满足 设计 需求 的 组 件 ; 
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2. 时 序 约束 和 所 有 的 位 置 约束 ; 

3. 仿真 模型 ; 

4. 使 用 说 明 书 ， 应 该 包含 该 IP 核 的 用 户 手 册 以 及 所 有 的 勘误 表 。 关 于 这 部 
分 内 容 的 细节 见 9.5.1 节 ; 

5. 用 户 接口 ; 

6. 与 设计 师 想 使 用 的 任何 系统 集成 工具 兼容 。 


9.5.1 IP 说明书 


如 前 所 述 ，IP 说 明 书 应 包括 用 户 手 册 和 勘误 表 。 它 还 应 当 包 含 详细 记录 了 下 
核 和 文档 变化 历史 的 版 本 控制 文档 。IP 核 的 版 本 必须 与 其 本 里 及 说 明 书 保持 一 
致 。 


虽然 对 菏 个 IP 核 而 言 ， 其 设计 功能 很 可 能 是 独一无二 的 ,但 所 有 IP 核 说 明 
书 的 格式 却 要 求 完全 一 致 。 这 包括 使 用 说 明 书 和 具有 上 自 说 明 性 的 RTL 代码 格式 。 
说 明 书 应 当 包 括 一 个 用 于 展示 该 IP 如 何 与 其 他 模块 进行 连接 的 设计 举例 或 
者 测试 平台 。 在 理想 情况 下 ， 这 个 例子 或 者 测试 平台 可 以 用 于 演示 该 IP 的 功能 。 
设计 的 文件 结构 必须 和 所 有 其 他 的 IP 相同 ， 并 且 信 号 的 命名 规则 必须 遵循 
公司 的 编码 指导 原则 。 
对 于 参数 化 IP 组 件 ， 应 该 有 设置 参数 的 提示 。 


9. 5.2 用户 接口 


在 公司 内 部 推广 IP， 让 其 他 设计 师 都 知道 有 这 些 IP 存在 ， 可 用 于 设计 ， 最 
常用 方法 是 提供 这 些 IP 的 RTL 代码， 以 及 提供 如 何在 设计 中 使 用 它们 的 说 明 
书 。 虽然 这 样 做 有 效果 ， 但 对 最 终 用 户 而 言 ， 真 正 懂 得 如 何 使 用 这 些 别 人 编写 的 
IP 是 一 件 十 分 困难 的 工作 。 
提供 IP 组 件 时 ， 必 须 提 供 其 接口 清单 ， 这 样 做 可 以 帮助 用 户 理解 施加 在 该 
IP 组 件 上 的 约束 条 件 。 同 时 ， 还 至 少 需要 提供 一 个 命令 行 的 脚本 文件 ， 该 文件 
可 以 帮助 用 户 将 组 件 的 配置 参数 传递 到 IP 中 。 在 理想 的 情况 下 ， 设 计 工 具 应 该 
提供 图 形 用 户 界面 (GUI) 帮助 用 户 着 手 该 IP 的 使 用 。 
建议 设计 师 为 自己 设计 的 IP 提供 一 个 简单 的 图 形 用 户 界面 (GUI) 和 一 个 
接口 脚本 。 

用 户 应 能 通过 这 个 简单 的 图 形 用 户 界面 (GUI) ， 为 选用 的 I 了 设置 所 需 的 参 
数 、 设 置 约 束 条 件 ， 并 能 验证 用 户 选 用 的 卫 参数 和 约束 是 否 合理 。 

这 种 类 型 的 接口 可 以 帮助 设计 师 理解 该 IP 的 功能 ， 为 设计 模块 生成 正确 的 
验证 文件 和 脚本 ， 同 时 提供 一 个 链接 ， 方 便 设计 者 找到 有 关 该 IP 的 使 用 说 明 书 。 

这 种 类 型 的 接口 ， 设 计 者 经 常 可 以 在 卫 上 见 到 ， 它 们 是 由 FPCA 厂商 提供 
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的 ， 在 大 多 数 情况 下 ， 是 由 其 他 IP 供应 商 提供 的 。 


配置 IP 的 图 形 用 户 界面 (GUI) 应 尽量 简明 扼要 ， 只 要 能 向 设计 者 展示 配 
置 界面 能 对 哪些 参数 进行 设置 ， 并 允许 他 们 进行 设置 即 可 。 


Altera 公司 开发 工具 中 元 件 编辑 器 的 图 形 用 户 界 面 (GUI) 如 图 9-2 所 示 。 


Avalom-MM Clock Crossing Bridge - clock_crossing bridyge 


Avalon-MM Clock Crossing Bridge : 


Masterto-siave FIFD 


Frospihils 司 


Construct FFO with regsters nstead of memory biocks 


Slave-th-mastear FIEO 


FFO depth [8 可 


图 


9-2 Quartus 开 开 发 了 


中 元 件 编辑 器 配置 IP 的 图 形 用 户 界 面 (GUI) 


若 设计 师 的 软件 编程 能 力 还 行 , 则 用 Tcl A Tk 或 Java 编程 语言 创建 一 个 类 似 
的 图 形 用 户 界面 (GUI) 并 不 困难 。 

若 设计 师 的 软件 编程 能 力 不 行 , 则 可 以 采用 FPGA 厂商 提供 的 IP 图 形 用 户 界 
面 开发 工具 ， 但 这 样 做 必须 使 用 FPCA 开发 工具 。 
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9. 5.3 与 系统 集成 工具 的 兼容 性 


标准 的 设计 输入 和 设计 集成 工具 能 减少 设计 输入 的 开销 。 

系统 集成 工具 可 以 根据 P 模块 的 互联 自动 生成 HDL 代码 。 由 主要 FPCA 三 
商 提供 的 耳 集成 工具 都 拥有 此 项 功能 。 这 些 系统 集成 工具 能 够 自动 完成 RTL 设 
计 师 不 得 不 处 理 的 比较 无 聊 的 设计 任务 ， 如 地 址 译 码 、 数 据 复 用 、 处 理 囊 系统 中 
等 待 状态 的 产生 、 动 态 总 线 位 宽 调 整 、 从 动 方 仲裁 和 模块 的 直接 互联 等 设计 任 
务 。 这 个 能 自动 完成 设计 任务 的 工具 类 似 于 软件 连接 器 。 这 个 软件 连接 器 可 在 主 
程序 外 创建 一 个 可 执行 程序 ， 即 选择 某 个 已 经 过 预 编 译 的 IP 库 函 数 转换 为 具体 
的 电路 网 表 并 生成 相应 的 仿真 模块 。 

系统 集成 工具 ， 如 Altera 公司 的 SOPC Builder， 人 允许 设计 者 根据 需求 从 多 种 
系统 模块 中 选择 必要 的 组 件 ， 自 动 地 构造 出 一 个 完整 的 复杂 互 连 系统 。 这 使 工程 
师 们 能 够 把 低层 次 的 集成 细节 交 给 计算 机 处 理 ， 集 中 精力 思考 更 有 价值 的 系统 架 
构 ， 大 大 提高 设计 效率 。 

在 系统 设计 的 架构 探索 阶段 和 实现 阶段 应 该 使 用 这 种 系统 集成 工具 ， 以 便 提 
高 设计 效率 。 系 统 集 成 工具 拥有 以 下 功能 : 设计 模块 能 即 持 即 用 地 连接 到 系统 
中 ， 选 定 的 架构 可 以 自动 快速 地 转换 成 RTL 代码， 无 需 手 动 修改 仲裁 逻辑 、 位 
宽 适 配 逻 辑 、 存 储 器 映射 等 。 这 些 功 能 使 得 系统 结构 的 探索 简单 易 行 ， 设 计 师 就 
能 快速 地 尝试 不 同 的 架构 。 一 旦 找到 了 理想 的 系统 架构 ， 设 计 师 就 能 微调 系统 中 
的 模块 ， 以 满足 设计 的 总 体 目 标 。 


9.5.4 了 IP 的 安全 性 


设计 师 从 卫 供应 商 处 购买 的 了 通常 是 经 过 加 密 处 理 的 。IP 供应 商 这 样 做 是 
为 了 保护 I 组 件 的 RIL 代码 的 完整 性 并 防止 非 授权 用 户 利 用 他 们 的 IP 进行 设 
计 。 卫 供应 商 和 EDA 供应 商 使 用 的 加 密 策 略 往往 各 不 相同 。 然 而 ， 从 卫 使 用 者 
的 视角 来 看 ， 设 计 师 所 关心 的 是 哪些 工具 能 支持 该 IP 的 综合 ， 以 及 从 IP 供应 商 
那里 得 到 的 仿真 模型 的 质量 是 否 满 足 设计 要 求 。 

工业 界 中 已 采取 行动 提供 标准 的 IP 加 密 方 法 。IEEE 学 会 已 经 发 布 了 基于 开 
放 模 式 接口 (Open Mode Interface，OMI) 的 IEEE 1499 标准 。 该 标准 使 RTL 代码 
能 够 被 编译 成 为 一 种 禁止 反 向 设计 的 模型 格式 。 这 些 模型 能 在 与 OMI 兼容 的 仿 
真 器 中 进行 仿真 。 它 的 好 处 在 于 仿真 模型 和 综合 模型 使 用 同一 个 RIL 代码。 这 
样 做 减少 了 IP 供应 商 的 开发 工作 量 。 

有 些 卫 供应 商 愿 意 提供 卫 的 源 代码 。 这 简化 了 设计 流程 ， 但 其 购买 成 本 通 
常 远 高 于 加 密 过 的 RTL 代码 。 

如 果 设 计 师 打算 提供 加 密 的 卫 ， 就 必须 与 相关 的 FPGA 厂商 合作 ， 以 利用 它 
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们 的 加 密 工具 。 
有 些 IP 供应 商 提 供 模糊 化 后 的 RTL 代码 。 让 信和 号 的 命名 显得 毫 无 意义 ， 从 
而 使 代码 难以 理解 ， 这 为 卫 的 RTL 代码 提供 了 一 种 有 限 的 安全 措施 。 模 糊 化 使 
得 非 授权 用 户 难 以 对 RTL 代码 进行 逆 设 计 。 但 模糊 化 并 不 能 妨碍 设计 的 编译 。 

有 些 FPGA 厂商 允许 设计 师 只 提供 编译 后 格式 的 IP， 而 不 是 RTL 代码 的 IP。 
举 个 例子 ， 在 布局 布线 锁定 的 情况 下 使 用 增 量 的 编译 方法 对 设计 模块 进行 编译 。 
这 一 级 别 的 IP 可 以 确保 IP 的 性 能 ， 又 减少 了 维护 IP 的 负担 , 但 卫 只 能 应 用 于 
某 种 特定 的 FPGA 器 件 。 

设计 师 可 以 用 多 种 方法 为 其 他 用 户 提 供 PP。 大 多 数 公 司 内 部 的 人 PP 重用， 提 
供 的 是 RTL 代码 ， 而 出 售 的 IP 则 需要 对 其 代码 进行 加 密 。 然 而 ， 有 些 公司 在 发 
布 关 键 卫 模块 时 ， 在 公司 内 部 也 实施 加 密 策略 。 

由 于 加 密会 增加 设计 流程 的 复杂 性 ， 所 以 建议 只 在 设计 模块 的 安全 性 是 主要 
考虑 因素 时 ， 设 计 师 才 对 设计 模块 使 用 加 密 或 模糊 化 措施 。 


9.6 IP 重用 的 检查 清 


1. 购买 还 是 自己 设计 该 项 功能 ? 

2. 说 明 书 中 是 否 已 明确 说 明 该 项 设计 是 可 重用 的 ? 

3. 选择 恰当 的 IP 实现 方法 ， 换 言 之， 是 用 RTL 编码 ， 还 是 用 高 层次 综合 器 
生成 该 IP? 

4. 如 果 自 己 编写 IP 组件 的 RTL 代码 ， 则 应 遵循 RTL 编码 的 指导 原则 。 

5. 如 果 自 己 编写 了 组 件 的 RIL 代码 ， 则 应 将 该 下 参数 化 。 

6. IP 设计 模块 应 使 用 标准 接口 。 

7. 必须 对 IP 的 RIL 代码 做 加 密 或 模糊 化 处 理 吗 ? 

8. 自己 设计 的 IP 是 否 已 遵循 IP 封装 入 库 的 指导 原则 ? 
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10.1 软件 接口 


应 用 软件 和 RTL 代码 之 间 的 主要 接口 是 寄存 器 地 址 映射 表 。 在 设计 过 程 中 ， 
软件 、 硬 件 和 其 他 有 关 人 员 都 需要 参考 寄存 器 地 址 映射 表 。 

这 给 工程 项 目 中 的 固件 、RTL 代码 和 硬件 验证 、 以 及 它们 与 技术 文档 的 一 臻 
性 造成 了 困难 。 这 不 仅 涉及 到 公司 内 部 使 用 的 技术 文档 ， 还 涉及 在 IP 开发 时 提 
供给 最 终 用 户 的 文档 。 

正 因为 如 此 ， 为 避免 重新 编写 硬件 和 /或 固件 ， 应 该 尽量 减少 信息 的 修改 ， 
必须 对 信息 修改 严 加 管理 ， 并 将 每 次 信息 修改 的 细节 传达 给 整个 设计 团队 中 的 每 
个 成 员 。 


10.2 寄存 器 地 址 映射 表 的 定义 


寄存 器 地 址 映射 表 通 常 有 许多 不 同 的 名 称 : 控制 和 状态 寄存 器 (CSRs)、 内 
存 映 射 寄存 人 器、 寄存 髓 文件 、 寄 存 器 块 或 奇 存 吕 接口。 控制 和 状态 寄存 器 专门 用 
于 存放 软件 与 硬件 之 间 相 互 交 流 的 数据 。 每 个 IP 模块 提供 一 个 可 映射 到 软件 接 
口 地 址 的 寄存 器 接口 。 寄 存 器 地 址 映射 表 使 得 软件 编程 人 员 可 以 看 到 软 /硬件 之 
间 的 接口 ， 从 而 进行 正确 的 读 / 写 操作 ， 以 便 在 硬件 和 软件 之 间 进 行 有 效 的 通信 。 


10.3 寄存 器 地 址 映射 表 的 使 用 

正如 本 章 开始 提 及 的 那样 ， 在 整个 设计 过 程 中 ， 多 个 领域 的 专业 技术 人 员 需 
要 使 用 寄存 器 地 址 映射 表 ， 不 同 专业 所 要 求 的 数据 格式 略 有 差异 。 
10.3.1 IP 的 选择 


作为 IP 评选 准则 的 一 部 分 ， 设 计 者 必须 理解 软件 和 硬件 如 何 与 该 IP 接口 。 
寄存 器 地 址 映射 表 就 是 为 解决 软件 如 何 与 卫 接口 而 创建 的 。IP 核 的 用 户 使 用 说 
明 书 应 该 反应 这 个 信息 。 


. 84 . FPGA 设计 


: 基于 团队 的 最 佳 实践 


10.3.2 软件 工程 师 的 接口 


为 了 开发 和 硬件 接口 的 软件 驱动 程序 ， 软 件 工程 师 需要 


熟悉 


TY 


寄存 器 地 址 映射 


表 。 软 件 工程 师 总 是 希望 寄存 器 映射 信息 以 软件 头 文件 的 形式 出 现 ， 在 头 文件 中 
定义 该 组 件 的 基地 址 和 寄存 器 侦 移 地 址 〈 见 图 10-1) 。 


#ifndef _ALT_ ETH 10G REGS H_ 
#define ALT ETH 10G REGS H_ 


#include *alt_types. h* 


/* Revision register */ 

#define ALT ETH 10G REV_REG 

#define IOADDR_ALT ETH 10G REV(base) 
#define IORD ALT_ETH 10G REV(base) 


#define A rH 10G REV_CORE REVISION OFST 
#define A rH 10G REV_CORE REVISION MSK 
#define A rH 10G_ REV _USER REVISION OFST 
#define A [H 10G REV_USER REVISION MSK 


LT_E] 
LT_E] 
LT_E] 
LT_E] 


/* Scratch register */ 

#define ALT_ETH 10G SCRATCH REG 

#define IOADDR_ALT ETH_ 10G SCRATCH(base) 
#define IORD ALT ETH 10G SCRATCH(base) 
#define IOWR_ALT ETH 10G SCRATCH(base,data) 


* Command register */ 

#define ALT_ETH 10G CMD REG 

#define IOADDR_ALT ETH_10G CMD(base) 
#define IORD ALT ETH 10G CMD(base) 
#define IOWR_ ALT ETH 10G CMD(base,data) 


#define ALT_ETH 10G CMD TX ENA OFST 
#define ALT_ETH 10G CMD TX ENA MSK 
#define ALT ETH 10G CMD RX ENA_OFST 
#define ALT_ ETH 10G CMD RX ENA MSK 


#define ALT ETH 10G CMD XON GEN OFST 


#define ALT_ETH 10G CMD XON_ GEN MSK 


图 10-1 


10.3.3 RTL 工程 师 的 接口 


Altera SOPC Builder 了 


0x00 
_IO CALC ADDRESS NATIVE (base, ALT_ETH_10G_REV_REG) 
IORD 32DIRECT (base, ALT_ ETH 10G REV REG) 


(0) 
(0x0000FFFF) 
(16) 
(OxFFFF0000) 


Ox04 
_IO CALC ADDRESS NATIVE(base,ALT ETH 10G SCRATCH REG) 
IORD 32DIRECT(base, ALT_ETH 10G SCRATCH REG) 
IOWR_32DIRECT(base, ALT_ETH 10G SCRATCH REG,data) 


0x08 

_IO CALC ADDRESS NATIVE(base, ALT_ETH 10G CMD REG) 
IORD 32DIRECT(base, ALT_ETH 10G CMD REG) 

IOWR_ 32DIRECT(base, ALT_ETH 10G COMMAND CONFIG REG.data) 


(0) 
(0x00000001) 
(1) 
(0x00000002) 
(2) 
(0x00000004) 


[有 具 生成 的 头 文件 示例 


RTL 工程 师 需要 将 寄存 器 地 址 映射 表 连 接 到 系统 的 其 余部 分 。 这 部 分 工作 包 


括 为 寄存 器 的 每 个 比特 位 编写 逻辑 ， 以 及 为 读 / 写 周期 创建 地 址 译 码 器 。 在 设计 
刚 开 始 时 就 定义 寄存 器 映射 表 ， 并 且 在 整个 设计 周期 内 不 断 进行 维护 ， 这 对 RTL 
设计 来 说 是 一 项 极 具 挑 战 性 的 任务 。 因 为 在 整个 设计 周期 中 的 某 些 时 候 ，RTL 设 
计 师 有 可 能 不 得 不 修改 寄存 器 地 址 映射 表 的 部 分 内 容 。 寄 存 融 地 址 映射 表 的 纺 
码 、 技 术 说 明 书 的 编写 、 审 核 、 以 及 与 寄存 器 地 址 映射 表 的 数据 交流 ， 整 个 过 程 
是 极 容易 出 错 的 工作 ， 很 多 RTL 设计 师 不 愿意 进行 此 项 工作 。 

具 可 以 协助 完成 此 项 工作 。FPCA 厂商 提供 的 系统 


幸运 的 是 市 面 上 有 几 个 工 
集成 工具 能 自动 生成 软件 头 文件 ， 在 硬件 系统 设计 工程 师 和 软件 工程 师 之 间 提 供 
了 一 个 自动 化 的 接口 。 此 外 ， 这 些 自动 生成 的 软件 头 文件 还 会 负责 生成 地 址 译 码 
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器 的 逻辑 。 

有 些 EDA 工具 可 以 提供 更 加 高 级 的 功能 。 这 些 工 具 能 根据 寄存 器 的 描述 为 
该 寄存 器 地 址 映射 表 创建 可 综合 的 RTL 代码 ， 生 成 软件 头 文件 和 用 来 验证 的 头 
文件 ， 还 可 以 创建 各 种 格式 的 用 户 使 用 说 明 书 。 


10.3.4 接口 的 验证 


开发 若干 个 测试 平台 对 RTL 级 寄存 器 地 址 映射 表 的 操作 做 全 面 的 验证 是 良 
好 的 工程 习惯 。 因 此 ， 验 证 工程 师 需要 寄存 器 地 址 映射 表 的 具体 细节 ， 而 其 格式 
要 和 其 正在 使 用 的 验证 语言 一 致 。 

作为 验证 周期 的 一 部 分 ， 设 计 者 应 该 依据 设计 规范 规定 的 细节 来 验证 软件 对 
寄存 器 映射 表 的 读 / 写 。 若 将 寄存 器 地 址 映射 表 的 相关 文档 作为 功能 验证 清单 ， 
该 测试 验证 也 可 以 在 FPGA 器 件 上 进行 。 


10.3.5 文档 


正如 本 章 开头 提 到 的 那样 ， 文 档 指 的 是 设计 团队 的 内 部 文件 和 提供 给 了 最 
终 用 户 的 文件 。 

每 当 寄 存 器 地 址 映射 表 的 RTL 代码 有 改动 时 ， 设 计 师 要 负责 更 新 相关 的 文 
档 并 与 每 个 受到 影响 的 小 组 一 起 评估 本 次 改动 。 

描述 寄存 器 地 址 映射 表 所 使 用 的 格式 必须 和 所 有 设计 者 使 用 的 命名 规则 保持 
一 致 。 创 建 寄存 器 地 址 喘 射 表 的 设计 规范 ， 用 设计 规范 来 指导 文档 的 编写 就 可 以 
做 到 这 一 点 。 

工业 界 已 存在 一 个 专 为 卫 建 立 寄 存 器 地 址 映射 表 的 标准 格式 。 这 就 是 IP-XACT 
标准 ,该 标准 使 用 可 以 被 市 面 上 多 个 EDA 工具 读 人 的 XML 元 数据 (metadata) 。 然 而 ， 
对 于 数据 的 写 人 ,该 标准 还 没有 被 所 有 他 供应 商 和 EDA 工具 广泛 采纳 。 

设计 者 也 许 应 该 考虑 采用 该 标准 而 不 是 开发 自己 的 格式 ， 因 此 建议 设计 者 在 
项 目 开 始 之 前 就 认真 评估 该 标准 。 


10.4 小 结 


寄存 器 地 址 映射 接口 是 软件 工程 师 和 RTL 工程 师 间 的 主要 接口 。 在 设计 过 
程 中 不 同 部 门 都 要 使 用 该 信息 ， 为 满足 不 同 部 门 自身 的 需求 ， 对 该 信息 的 格式 要 
求 有 所 不 同 。 因 此 ， 必 须 对 接口 信息 严 加 管理 ， 任 何 有 关 接 口 信息 的 改动 必须 与 
需要 该 信息 小 组 一 起 审核 通过 。 由 于 实际 中 这 项 工作 非常 耗 时 ， 并 且 手 动 更 新 使 
用 该 信息 的 所 有 文件 格式 又 极 易 出 错 ， 所 以 建议 设计 师 购买 专用 于 寄存 器 地 址 映 
射 管理 的 EDA 工具 。 


第 11 章 功能 验证 


11.1 简介 


每 个 设计 小 组 都 需要 回答 下 面 两 个 简单 的 问题 : 

1) 设计 功能 是 否 正确 ? 

2) 验证 过 程 是 否 完整 ? 

设计 师 可 能 要 花 设计 周期 中 60% 以 上 的 时 间 才 能 得 到 比较 满意 的 回答 。 什 
么 是 正确 的 功能 ? 验证 到 什么 程度 才 算 完 ? 光 把 这 两 个 问题 说 清楚 就 是 一 件 艰难 
的 任务 。 

以 前 ，FPGA 的 设计 规模 很 小 ， 而 且 很 多 设计 师 并 不 关心 设计 重用 的 概念 。 
那 时 候 ，FPCA 设计 师 采 取 “ 开 顺风 船 (blow and go) ”的 策略 来 验证 FPCA 设 
计 。 他 们 先 编写 RTL 级 设计 模块 ， 接 着 进行 粗略 的 功能 仿真 ， 然 后 对 FPCA 器 
件 编程 ， 最 后 在 系统 中 测试 设计 。 如 果 发 现 问题 ， 他 们 就 会 修改 代码 ， 并 重复 这 
个 过 程 。 然 而 对 于 规模 大 、 功 能 复杂 和 质量 高 的 系统 而 言 ， 这 种 设计 方法 就 行 不 
通 了 。 

FPCA 需 件 的 可 编程 特性 确实 给 设计 验证 武器 库 里 添加 了 一 件 功 能 强大 的 武 
器 。 然 而 ， 就 可 编程 特性 本 身 而 言 ， 它 对 创建 可 靠 的 和 可 重用 的 设计 并 没有 什么 
用 处 。 

许多 出 版 物 和 EDA 工具 都 致力 于 解决 功能 验证 问题 。 

有 很 多 不 同 的 验证 技术 可 用 来 验证 设计 是 否 已 达到 技术 说 明 书 所 规定 的 要 
求 。 许 多 用 于 ASIC 设计 的 验证 技术 也 适用 于 FPGA 设计 的 验证 。 如 前 所 述 ，FP- 
GA 器 件 的 可 编程 特性 有 助 于 以 FPCA 为 实现 目标 的 设计 验证 。 本 章 将 针对 FPGA 
设计 和 (以 FPGA 为 目标 器 件 的 ) IP 设计 ， 阐 述 以 功能 验证 效果 好 而 闻名 的 验 
证 技术 。 


11.2 功能 验证 面临 的 挑战 


功能 验证 的 高 层次 目标 是 为 了 验证 指定 的 设计 功能 。 这 既 适 用 于 完整 的 设 
计 ， 也 适合 于 任何 部 件 的 设计 。 
功能 验证 必须 覆盖 设计 的 所 有 操作 模式 。 这 包括 所 有 的 边界 情况 。 设 计 者 最 
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不 希望 看 到 的 是 当 设计 成 为 产品 后 ， 由 于 所 设计 的 系统 进入 到 一 种 设计 者 事先 没 
有 考虑 到 或 测试 到 的 操作 模式 ， 从 而 导致 产品 出 现 严重 的 故障 。 

应 用 接口 必须 按 设计 预期 运行 ， 换 言 之， 测试 必须 模仿 设计 和 系统 其 他 部 分 
的 互动 。 

在 FPCA 器 件 通过 标准 协议 接口 〈 例 如 PCI Express 或 Serial Rapid IO) 与 
系统 其 他 部 分 接口 时 ， 有 必要 验证 该 接口 模块 是 否 与 相应 的 标准 兼容 。 

在 设计 参数 化 IP 的 场合 ， 根 据 参 数 对 该 IP 的 所 有 结构 变化 做 一 次 完整 的 测 
试 是 很 有 必要 的 。 因 为 这 样 做 可 以 增强 IP 使 用 者 的 信心 ， 使 他 们 相信 该 IP 可 以 
满足 需求 。 

在 IP 为 了 可 重用 已 经 封装 好 ， 而且 有 用 户 接口 时 ， 必 须 验证 用 户 接 口 能 按 
预期 运行 ， 并 且 支 持 所 有 的 操作 系统 。 

最 后 ， 设 计 者 需要 审核 IP 模块 的 设计 文档 是 否 清晰 完整 ， 与 IP 核 的 行为 是 
否 一 致 。 

这 上 听 起 来 像 是 需要 做 很 多 工作 …… 而 事实 的 确 如 此 ! 

在 规定 的 时 间 范 围 内 利用 可 找到 的 资源 ， 如 何 获 得 足够 的 验证 覆盖 度 是 设计 
师 必 须 面 对 的 挑战 。 

设计 师 如 何 确定 覆盖 测试 已 达到 可 以 接受 的 程度 呢 ? 

这 些 问 题 的 答案 来 自 于 验证 计划 。 验 证 计划 必须 详细 说 明了 验 证 覆盖 度 目 标 和 
其 他 指标 。 因 此 ， 验 证 计划 会 影响 项 目的 计划 。 

设计 师 在 编写 设计 功能 规范 的 同时 ， 必 须 制 订 设 计 的 验证 计划 。 

在 设计 环节 中 ， 需 要 安排 一 个 系统 。 该 系统 能 够 在 设计 的 全 过 程 包括 验证 周 
期 期 间 ， 对 照 验证 计划 对 设计 的 进展 情况 进行 全 面 的 监测 。 该 系统 必须 能 够 管理 
测试 生成 的 大 量 数据 ， 并 对 照 验证 计划 报告 项 目的 进展 情况 。 


11.3 ”有关 验证 的 术语 


1. 被 测 需 部 件 (Device Under Test，DUT) : 被 测试 的 IP。 

2. 断言 (覆盖 点 ) (Assertions (coverage points ) ) : 当 设 计 正 常 运行 时 ， 由 
断言 描述 的 设计 工作 状态 为 真 。 当 设计 运行 不 正常 时 ， 断 言 被 激活 。 它 有 效 地 覆 
盖 被 测 器 部 件 (DUT) 的 所 有 状态 。 

3. VMM (Synopsys 公司 《SystemVerilog 验证 方法 学 手册 》 书 名 的 英文 缩 
写 ) : 该 书 详细 地 介绍 了 用 SystemVerilog 对 复杂 设计 进行 全 面 验证 的 方法 学 。 

4. 测试 平台 (Testbench) : 测试 平台 是 可 在 其 上 运行 设计 ， 并 且 设计 的 正确 
性 能 得 到 验证 的 运行 测试 环境 。 

5. 执行 器 〈Transactors) : 在 测试 平台 环境 中 ， 执 行 器 〈transactor) 是 定义 
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山 由 


有 件 发 生 顺 序 或 任务 执行 顺序 的 模型 。 
6. 记分 板 (Scoreboards) : 记分 板 是 一 种 数据 结构 ， 该 结构 可 保存 预期 的 操 
作 结 果 ， 以 便 与 实际 达到 的 结果 相 比 较 ， 

7. 寄存 器 抽象 屋 (Register Abstraction Layer，RAL): VMM RAL 自动 为 存储 
器 映射 的 寄存 器 和 存储 器 创建 高 层次 的 抽象 层 。 在 《SystemVerilog 验证 方法 学 手 
册 》 中 对 寄存 器 抽象 层 有 详细 的 描述 。 

8. 可 执行 的 规范 (Executable specification ) : 可 执行 的 规范 是 描述 设计 功能 、 
硬件 和 /或 软件 的 高 层次 模型 。 它 通常 用 高 层次 语言 编写 ,例如 C、C++、System 
C 或 SystemVerilog。 

9. 回归 测试 ( Regression Tests ) : 回归 测试 是 每 次 设计 修改 之 后 ， 按 既定 规 
律 ， 例 如 在 每 天 晚上 或 者 每 个 周末 ， 结 合 具 体 应 用 进行 的 一 系列 测试 。 其 目的 是 
为 了 确保 设计 修改 后 没有 引入 新 的 错误 。 回 归 测 试 是 一 个 用 来 证 明 完 成 的 设计 能 
按照 说 明 书 的 要 求 运行 的 自动 化 测试 环境 。 

10. 开放 的 验证 方法 学 (OVM ，Open Verification Methodology) : 由 Cadence 
和 MentorGraphic 两 家 公司 共同 开发 的 一 个 标准 SystemVerilog 库 和 验证 方法 学 。 


11.4 RTL 仿真 和 门 级 仿真 的 对 比 


RTL 级 仿真 执行 的 是 不 考虑 设计 时 序 延 迟 的 功能 验证 。RTL 仿真 通常 被 用 来 
验证 设计 的 功能 ， 而 时 序 分 析 通 常 被 用 来 验证 设计 中 没有 时 序 冲 突 。 

门 级 仿真 使 用 布局 和 布线 后 产生 的 时 序 网 表 。 它 包含 用 标准 延迟 格式 
(Standard Delay Format，SDF) 表达 的 器 件 时 序 延 迟 。 由 于 门 级 仿真 包含 时 序 信 
息 ， 所 以 通过 门 级 仿真 ， 可 以 观察 到 设计 在 心 片上 运行 更 为 准确 的 细节 。 与 RTL 
仿真 相 比 ， 时 序 仿真 需要 花费 相当 长 的 时 间 。 所 以 在 实际 工作 中 ， 很 多 设计 师 不 
愿意 在 诸如 视频 、 图 像 处 理 等 应 用 以 及 大 规模 设计 中 使 用 时 序 仿真 。 因 此 ， 建 议 
只 对 关键 的 设计 模块 而 不 是 完整 的 设计 进行 时 序 仿 真 ， 或 者 在 系统 硬件 检查 的 调 
试 过 程 中 发 现 问 题 后 ， 才 进行 时 序 仿 真 。 


11. 5 ”验证 方法 学 


为 了 圆满 地 完成 设计 的 验证 工作 ,设计 师 必须 采用 多 种 验证 技术 。 应 该 使 用 
功能 覆盖 和 代码 窗 盖 相 结 合 的 技术 ， 因 为 这 些 技术 是 相辅相成 的 。 对 于 某 些 协 
议 ， 设 计 师 也 应 该 进行 硬件 互 操作 性 测试 。 

最 后 ， 不 要 愁 了 目标 器 件 是 可 编程 的 。 在 设计 的 人 硬件 实现 中 ， 有 些 故障 很 难 
找到 ， 往 往 需 要 花费 数 天 或 数 周 的 仿真 时 间 才 能 解决 。 第 13 章 将 会 更 为 详细 地 
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描述 系统 在 线 调试 技术 。 
具体 的 验证 方法 应 该 使 用 以 下 几 个 步 又 。 


11.6 克服 复杂 性 


解决 测试 设计 复杂 性 问题 有 三 个 主要 的 原则 。 
11.6.1 设计 和 测试 的 模块 化 


用 单个 测试 就 能 对 设计 的 所 有 功能 做 全 面 的 验证 是 绝 不 可 能 的 。 因 此 ， 必 须 
针对 设计 的 不 同方 面 编写 不 同 的 测试 模块 。 设 计 和 测试 的 模块 化 除了 能 提供 一 个 
更 加 周全 的 验证 环境 外 ， 由 于 模块 化 的 测试 比较 容易 理解 ， 因 此 测试 移交 时 ， 其 
他 人 员 接 手 也 比较 容易 一 些 。 

对 大 设计 模块 而 言 ， 设 计 师 应 采用 第 8 音 中 所 描述 的 功能 验证 方法 。 将 设计 
分 解 成 知 干 个 较 小 的 子 设计 ， 并 在 验证 完整 设计 之 前 彻底 地 验证 每 一 个 子 设计 。 


11.6.2 规划 预期 操作 


创建 测试 是 为 了 确认 设计 能 在 预期 的 或 规定 的 操作 模式 下 正常 地 运行 。 所 完 
成 的 设计 应 该 能 在 各 种 规定 的 条 件 下 ， 使 每 一 种 操作 模式 都 能 正确 地 运行 。 因 
此 ， 这 些 测试 必须 能 对 功能 描述 和 设计 说 明 书 中 列 出 的 所 有 功能 做 逐 项 的 验证 。 

令 设计 在 各 种 边 角 情 况 下 运行 ， 确 认 在 每 种 情况 下 ,设计 都 能 如 预期 的 那样 
正常 地 运行 。 

作为 功能 测试 的 一 部 分 ， 要 确保 设计 师 能 对 每 个 寄存 器 的 比特 位 和 每 个 端口 
上 的 每 个 信号 进行 操作 。 

当 验 证 的 设计 由 多 个 参数 化 模块 组 成 ， 而 且 这 些 模块 中 的 参数 可 由 用 户 设置 
时 ， 设 计 师 必须 运行 所 有 可 能 的 模式 组 合 以 测试 连接 模块 间 的 互动 。 

每 次 操作 后 ， 必 须 验 证 系统 是 否 已 返回 正确 的 状态 。 


11.6.3 应 对 意外 状态 的 计划 


由 于 存在 没有 被 测试 到 的 系统 状态 ， 系 统 运 行 有 可 能 误 入 一 个 不 能 自 恢 复 的 
状态 ， 这 是 设计 师 最 不 希望 看 到 的 。 因 而 设计 师 必 须 对 那些 可 能 出 现 的 意外 状态 
进行 测试 。 这 些 意 外 状态 因应 用 不 同 而 不 同 ， 诸 如 向 上 溢出 、 向 下 溢出 、CRC 
错误 和 运行 中 止 等 等 。 作 为 意外 状态 测试 计划 的 一 部 分 ， 设 计 师 应 该 测试 那些 计 
划 以 外 的 状态 ， 考 察 系统 是 否 能 从 意外 状态 中 恢复 。 意 外 状态 不 一 定 会 出 错 ， 这 
是 因为 在 实际 系统 中 很 可 能 不 会 出 现 这 种 意外 状态 。 关 键 是 所 设计 的 系统 是 否 能 
从 极 少 发 生 的 意外 状态 中 恢复 。 


“ 90 ， FPGA 设计 : 基于 团队 的 最 佳 实践 


意外 状态 测试 计划 应 该 测试 那些 不 会 发 生 的 状态 ， 如 : 

1. 非法 状态 ; 

2. 违背 设计 前 提 的 状态 ; 

3. 违背 协议 的 状态 ; 

4. 在 运行 中 模式 变换 的 状态 。 

再 强调 一 下 ， 这 里 的 关键 因素 是 虽然 设计 的 运行 可 能 不 正常 ， 但 它 应 该 最 终 
能 恢复 过 来 。 

作为 PP 或 设计 模块 功能 验证 的 一 部 分 ,设计 师 应 测试 它 和 整个 设计 中 其 他 
模块 间 的 互动 ， 以 保证 接口 操作 按 预 期 运行 。 


11.7 功能 覆盖 


如 9.6 节 所 述 ， 为 降低 测试 的 复杂 度 ， 兼 容 性 测试 和 临界 测试 虽然 好 ， 但 其 
本 身 不 足以 全 面 测试 所 设计 的 系统 。 设 计 师 不 太 可 能 预测 和 运行 所 有 可 能 的 条 
件 ， 这 增加 了 系统 失效 的 风险 。 功 能 覆盖 测试 增强 了 设计 师 对 所 验证 设计 模块 或 
系统 的 信心 。 首 先 确定 有 多 少 设计 功能 已 经 在 验证 环境 中 运行 通过 。 再 针对 说 明 
书 中 的 其 他 特定 功能 逐一 创建 测试 案例 。 其 中 的 关键 点 在 于 设计 师 必 须 能 够 证 明 
应 该 被 检测 到 的 功能 都 进行 了 测试 。 

模块 和 整个 系统 的 测试 计划 应 详细 说 明 验 证 的 覆盖 度 。 这 里 的 覆盖 度 是 指 功 
能 履 盖 目 标 〈 译 者 注 : 必须 测试 哪些 设计 功能 ， 以 及 每 个 功能 必须 达到 的 指 
标 ) 。 

在 制订 功能 覆盖 目标 计划 时 ,设计 师 所 面临 的 挑战 是 要 确保 该 设计 实现 了 说 
明 书 中 所 描述 的 功能 ; 对 于 接口 而 言 ， 则 需要 符合 协议 规范 的 标准 。 

设计 师 要 按照 制订 的 功能 测试 计划 ， 逐 项 完成 功能 的 测试 ， 并 令 其 与 相应 的 
最 佳 参考 模型 所 描述 的 行为 匹配 。 

对 于 可 重用 设计 模块 而 言 ， 设 计 师 必须 完成 以 下 4 个 测试 : 

1. 被 测 咒 件 的 每 个 可 用 的 特性 和 功能 ; 

2. 各 种 配置 的 组 合 ; 

3. 可 施加 的 不 同类 型 的 激励 ; 

4. 被 测试 器 件 (DUT) 的 响应 。 

因为 定义 一 张 能 验证 100% 设 计 功 能 的 清单 十 分 困难 ， 所 以 功能 窗 盖 度 也 有 
局 限 性 。 因 此 ， 在 覆盖 空间 中 找 出 覆盖 的 漏洞 至 关 重 要 。 


11.7.1 定向 测试 
定向 测试 要 求 为 测试 计划 中 的 每 个 功能 的 测试 编写 一 个 测试 模块 。 想 要 获得 
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可 接受 的 功能 测试 覆盖 度 ， 人 工 编写 测试 模块 的 工作 量 非常 巨大 。 而 这 些 测 试 模 
块 被 重用 的 机 会 又 非常 小 。 

由 于 定向 测试 非常 耗 时 ， 因 此 最 好 只 用 于 典型 功能 的 测试 。 

小 模块 的 测试 ， 建 议 采 用 定向 测试 技术 ， 而 大 模块 或 系统 的 测试 ， 则 应 采用 
随机 约束 测试 技术 。 


11.7.2 随机 动态 仿真 


在 这 种 验证 方法 中 ， 随 机 激励 被 用 来 增加 功能 测试 的 覆盖 度 。 用 高 级 验证 语 
言 能 最 好 地 发 挥 这 个 验证 方法 的 作用 。 多 年 来 为 了 增加 测试 覆盖 度 ， 开 发 了 许多 
的 语言 和 工具 。SystemVerilog 是 这 个 领域 中 涌现 的 佼佼 者 ,已 被 IEEE 协会 批准 
并 定 为 标准 。 它 在 多 种 验证 语言 中 ， 得 到 了 最 广泛 的 工具 文 持 。 
建议 设计 师 考 虑 采用 SystemVerilog 来 验证 系统 设计 。 


11.7.3 受 约束 的 随机 测试 


受 约束 的 随机 测试 建立 在 随机 动态 仿真 基础 之 上 。 最 好 在 设计 的 早期 运行 随 
机 仿真 ， 以 便 发 现 大 量 的 错误 。 

SS i i 仿真 设计 
随 着 设计 接近 完成 时 ， 为 了 充 
分 覆盖 测试 空间 ， 就 需要 对 随 
机 激励 进行 约束 。 

只 需要 运行 一 个 受 约束 的 
随机 测试 就 能 覆盖 测试 计划 中 
的 多 个 测试 项 ， 这 样 可 以 缩短 
仿真 时 间 。 

这 种 方法 也 可 以 检测 到 测 
试 计划 中 没有 涉及 到 的 问题 / 错 
误 〈 见 图 11-1) 。 图 11-1 受 约束 的 随机 测试 流程 


11.7.4 SystemVerilog 用 于 设计 和 验证 


实际 上 SystemVerilog 将 三 种 语言 合 为 一 体 。 

1. SystemVerilog 包含 比 Verilog 和 VHDL 更 为 强大 的 可 用 于 设计 和 综合 的 
架构 。 

2. SystemVerilog 拥有 更 为 先进 的 测试 平台 架构 ， 以 产生 测试 激励 和 履 盖 。 

3. SystemVerilog 支持 断言 结构 ， 以 捕捉 设计 师 的 意图 。 

SystemVerilog 本 身 文 持 由 覆盖 率 驱 动 的 受 约束 的 随机 验证 。 

市 面 上 主要 的 EDA 仿真 器 都 拥有 预先 验证 过 的 断言 库 选 项 。 


调试 失败 


更 新 随机 种 
子 和 /或 更 改 
约束 条 件 
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目前 ， 业 界 在 SystemVerilog 的 验证 方法 上 仍 存 在 分 上 疏 ， 因 而 有 VMM 和 OVM 
两 个 主要 的 验证 方法 库 。 把 这 两 个 库 标 准 化 ， 合 并 成 为 一 个 库 ， 是 发 展 趋势 。 
11.7.4.1 断言 

煌 言 被 用 来 检查 设计 师 所 做 的 假设 以 及 与 设计 有 关 的 行为 是 否 正确 。 在 动态 
仿真 过 程 中 ， 如 果 设 计 满足 或 违反 设计 规范 都 可 以 触发 断言 。 断 言 可 用 在 模块 级 
和 系统 级 的 测试 中 。 

网 本 肌 全 鸭 帮 症 全 全 二 生 全 全 林 古 国 罗 人 

灯 言 能 及 早 发 现 问题 ， 诸 如 FIFO 的 上 浇 人 下 游 错 误 。 断 言 还 能 截获 模块 间 
的 通信 ， 例 如 存储 器 接口 的 行为 。 


11.7.5 通用 测试 平台 方法 


编写 最 简单 的 测试 平台 时 ， 不 必 考 虑 验证 代码 的 编写 。 只 要 工程 师 自己 核对 
波形 并 判断 仿真 输出 的 波形 是 否 与 预期 的 一 致 即 可 。 这 种 方法 的 缺点 是 设计 师 必 
须 对 设计 有 充分 的 理解 ， 而 且 还 要 理解 输出 的 波形 才 行 ; 而 别 的 工程 师 做 仿真 
时 ， 则 必须 花费 很 长 的 时 间 才 能 理解 仿真 输出 的 波形 ， 因 而 故障 漏 检 很 可 能 
发 生 。 

这 种 观察 波形 的 测试 方法 最 适合 用 在 不 准备 重用 的 简单 模块 的 设计 中 。 

设计 师 编 写 “ 测 试 装置 和 接线 ”代码 ,产生 激励 信 叶 ， 施 加 到 实例 引用 的 
设计 模块 上 ( 见 图 11-2)。 


mycode tb.vhd (or.v) 


clk 区 mycode.vhd(or.v) 


本 Cd process 
控制 每 个 信号 的 
单个 处 理 


reset_assignment 


图 1122 ”需要 人 工 检查 波形 的 简单 测试 平台 
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11.7.6 自 验证 测试 平台 


编写 自 验证 的 测试 平台 比较 困难 一 些 。 必 须 充分 理解 待 测试 模块 ， 才 有 可 能 
写 出 “期 望 的 输出 ”。 由 于 “期 望 的 输出 ”中 的 错误 很 难 找到 ， 使 用 这 种 方法 必 
须 事先 做 相当 多 的 工作 。 然 而 一 旦 自 验 证 的 测试 平台 设置 后 ， 设 计 师 就 可 以 进行 
测试 ， 很 快 就 能 得 到 通过 或 失败 的 结论 。 

测试 可 重用 的 设计 模块 应 该 使 用 自 验 证 的 测试 平台 。 

在 编写 自 检验 测试 平台 时 ， 为 了 能 对 输出 进行 监测 ， 设 计 师 必须 在 已 有 的 处 
理 过 程 中 添加 一 些 功 能 , 例如 添加 一 个 “比较 进程 ”或 类 似 的 进程 ， 用 以 将 仿真 
得 到 的 结果 与 预期 的 结果 进行 比较 〈 见 图 11-3 ) 。 


clk _ assignment 
mycode.vhd(or.v) 


datagen_ process 


reset_ assignment 


图 11-3 ” 自 检验 测试 平台 图 例 


这 类 测试 平台 可 以 产生 顺序 的 或 并 发 的 激励 ， 也 可 以 用 期 望 的 输出 向 量 产生 
这 些 激励 。 

通常 发 出 的 信 令 结构 非常 复杂 ， 如 果 不 用 保留 在 “时 间 片 ”中 的 向 量 ， 很 
难为 其 建立 模型 。 在 自 验 证 的 测试 平台 上 ， 利 用 内 部 数组 或 外 部 文件 ， 可 以 为 复 
杂 信和 号 结构 建立 模型 ， 从 而 产生 极其 复杂 的 信 令 激励 ， 自 动 地 对 系统 进行 
测试 。 

在 测试 平台 中 ,使 用 包含 激励 信号 和 预期 输出 信号 向 量 的 数组 时 ， 可 以 不 需 
要 进行 类 型 转换 。 这 昌 缩 短 了 仿真 时 间 ， 但 编写 测试 激励 比较 困难 ， 可 能 要 创建 
非常 大 的 文件 。 

当 使 用 包含 激励 和 期 望 结果 向 量 的 外 部 文件 时 ， 可 能 需要 进行 数据 类 型 的 转 
换 。 这 有 可 能 导致 仿真 变 慢 , 但 编写 测试 平台 则 相对 比较 容易 一 些 ( 见 图 11- 
4)。 


. 94 . FPGA 设计 : 基于 团队 的 最 佳 实践 


自 检测 
记录 表 
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11.7.7 形式 化 等 价 性 验证 


形式 化 等 价 性 验证 比较 设计 流 中 或 不 同 网 表 中 不 同 点 之 间 的 逻辑 等 价 性 。 它 
使 用 数学 方法 来 比较 同一 个 设计 的 两 种 版 本 在 逻辑 上 的 等 价 性 ， 而 不 是 使 用 测试 
向 量 进行 仿真 。 

形式 化 等 价 性 验证 通常 被 用 于 RTL 代码 与 综合 后 门 级 网 表 之 间 的 比较 ， 以 
此 来 保证 综合 优化 没有 引入 任何 错误 。 它 也 可 用 于 RTL 代码 或 综合 后 门 级 网 表 
与 布局 布线 后 网 表 之 间 的 比较 ， 以 确保 布局 和 布线 优化 没有 改变 设计 的 功能 。 
虽然 形式 化 等 价 性 验证 可 以 确定 两 个 网 表 是 否 在 功能 上 具有 一 致 性 ,但 它 并 
不 能 保证 其 功能 的 正确 性 。 如 果 RTL 设计 实现 的 功能 已 经 不 正确 了 ， 而 与 之 相 
比较 的 网 表 具 有 相同 的 功能 ， 形 式 化 等 价 性 验证 也 会 报告 “成 功 ” 。 因 此 ， 形 式 
化 等 价 性 验证 通常 用 于 已 通过 功能 验证 的 RIL 代码 和 门 级 网 表 间 的 比较 。 
形式 化 等 价 性 验证 工具 能 支持 的 设计 规模 往往 有 限 ， 因 此 它们 大 多 用 于 设计 
模块 的 验证 ， 而 不 用 在 完整 设计 的 验证 中 。 

但 对 于 FPGA 而 言 ， 这 个 技术 使 用 起 来 特别 困难 。FPGA 综合 优化 过 程 需 要 
对 寄存 器 进行 多 种 优化 ， 如 寄存 嚣 合并， 寄存器 复制 和 寄存 器 重 定时 。 前 两 种 优 
化 可 能 会 导致 伪 失 效 报告 。 对 设计 仔细 研究 后 ， 可 以 排除 这 些 伪 错 误 ， 但 却 非 常 
耗 时 。 第 三 种 优化 〈 即 寄存 器 重 定时 ) 经 常会 造成 逻辑 混乱 。 大 多 数 形式 化 等 
价 性 验证 工具 因为 无 法 对 付 由 FPGA 逻辑 综合 或 物理 综合 进行 的 寄存 器 重 定时 所 
造成 的 逻辑 混乱 ， 因 此 在 FPGA 设计 流程 中 几乎 不 使 用 形式 化 等 价 性 验证 。 


11-4 验证 系统 的 架构 
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11.8 代码 覆盖 度 


代码 覆盖 度 反 映 的 是 HDL 代码 运行 的 彻底 程度 。 

代码 覆盖 度 能 提供 有 多 少 行 代码 已 被 执行 的 信息 ， 它 提供 了 定量 计 基 测试 质 
量 的 手段 ， 因 此 有 助 于 指导 今后 测试 工作 的 方向 。 

代码 覆盖 测试 是 有 局 限 性 的 ， 因 为 它 并 不 关注 事件 发 生 的 先后 顺序 ， 也 不 检 
测 设 计 模 块 间 的 任何 交互 。 代 码 窗 盖 测试 只 关注 设计 中 有 些 什 么 ， 并 不 关心 没有 


实现 的 功能 。 总 而 言 之 ， 代 码 覆 盖 测 试 不 关注 设计 的 具体 功能 。 


代码 覆盖 测试 能 发 现在 随机 测试 下 没有 遍及 的 边 角 情 况 。 为 了 做 到 这 一 点 ， 


用 户 必须 编写 定向 测 试 案例 ， 对 没有 被 覆盖 的 区 域 进行 测试 。 


11.9 质量 评价 (QA) 测试 


11.9.1 功能 回归 测试 
功能 回归 测试 的 目的 是 企图 提供 一 个 自动 化 的 测试 环境 以 证 明 设 计 能 按 指定 


的 要 求 正 确 地 运行 。 


回归 测试 必须 确保 旧 错 误 不 再 重 现 。 在 调试 中 找到 并 改正 错误 之 后 ， 应 立即 
编写 测试 程序 以 检测 该 错误 是 否 已 被 纠正 ， 这 是 一 个 良好 的 工作 习惯 。 以 后 对 设 
计 做 任何 改动 时 ， 都 应 运行 这 个 测试 程序 以 保证 新 改动 没有 引入 新 错误 。 回 归 测 
试 将 自动 执行 这 个 测试 过 程 。 该 测试 应 该 被 归并 到 整个 设计 的 测试 套件 中 ， 其 中 
所 有 的 回归 测试 案例 都 将 在 这 个 测试 环境 中 自动 地 执行 。 

自动 化 质量 评价 (QA) 回归 测试 通常 通过 脚本 执行 对 IP 或 设计 的 自动 仿 
真 。 在 仿真 中 把 编译 和 运行 的 结果 与 一 个 已 知 的 合格 规范 进行 比较 。 这 个 测试 是 
自 检测 性 的 ， 会 产生 验证 日 志 ， 报 告 意 外 情况 。 请 注意 意外 情况 这 个 术语 的 使 


用 。 在 测试 中 发 现 问题 属于 意外 情况 ， 除 非 通过 分 析 ， 确 认 测试 所 发 现 的 问题 确 


实 是 由 设计 错误 所 引起 的 ， 才 算 发 现 设 计 错 误 。 通 常 意外 情况 是 由 测试 环境 问题 


引起 的 ， 而 不 上 


由 设计 错误 引起 的 。 如 果 确 实 是 测试 环境 的 问题 ， 就 应 该 在 解决 


该 测试 环境 问题 后 重新 测试 ， 观 察 测试 是 否 通过 。 回 归 测 试 环 境 必 须 能 编译 测试 
的 统计 结果 ， 并 报告 设计 的 健康 状态 。 其 中 包括 单个 设计 模块 的 报告 ， 也 包括 集 


成 了 所 有 设计 模块 的 最 终 系统 设计 的 报告 。 
11.9.2 可 重用 IP 的 图 形 界面 (GUI) 测试 


带 图 形 界面 的 了 P 虽然 简单 易 用 ,但 必须 通过 严格 的 测试 才能 确保 用 户 能 正 
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确 地 使 用 。 其 他 用 户 第 一 次 接触 你 的 IP 可 能 就 是 这 个 图 形 界面 。 你 总 希望 自己 
设计 的 IP 能 给 用 户 留 下 好 印象 ， 千 万 不 要 出 现 由 于 图 形 界 面 中 的 问题 使 得 你 的 
IP 不 受 欢 迎 的 情况 。 

市 面 上 有 测试 程序 可 以 用 来 对 图 形 界面 进行 回归 测试 ， 然 而 手动 测试 仍 是 最 
有 用 的 测试 手段 。 

测试 的 目的 是 : 

1. 确保 参数 化 图 形 界面 的 功能 与 预期 的 一 致 ; 

2. 在 正常 使 用 情况 下 ， 确 认 IP 的 性 能 指标 ; 

3. 在 错误 的 使 用 条 件 下 ， 检 查 IP 的 行为 。 

该 测试 需要 由 人 按照 测试 清单 对 图 形 界面 的 运行 情况 进行 逐 项 细致 的 测试 。 
测试 人 员 点 击 按钮 、 载 和 人 文档、 核查 预期 结果 并 编写 错误 报告 。 

这 种 测试 方法 相当 耗费 时 间 和 人 力 ， 但 可 以 保证 用 户 在 使 用 图 形 化 接口 时 有 
良好 的 体验 。 


11. 10 ”硬件 互 操 作 性 测试 


在 设计 和 标准 协议 接口 的 地 方 需要 进行 硬件 的 互 操作 性 测试 。 可 按 工业 标准 
ASSP 在 实验 室 对 硬件 的 互 操作 性 进 测 试 ， 也 可 以 在 互 操作 性 (industry plug-fe- 
sts) 和 测试 实验 室 对 其 进行 测试 。 


11. 11 软 / 硬 件 协同 验证 


市 场 上 可 以 购买 到 软 /硬件 协同 仿真 的 工具 。 这 种 工具 能 以 很 高 的 效率 在 便 
件 模型 运行 “c” 代 码 。 由 于 “c” 代 码 在 仿真 软件 上 的 运行 速度 非常 慢 ， 比 它 
在 硅 片 上 实际 和 运行 速度 慢 几 个 数量 级 。 因 而 为 了 加 快 仿真 速度 ， 通 常 在 开发 板 或 
终端 系统 的 FPCA 器 件 上 运行 “e” 人 代码， 以 避 开 用 仿真 软件 进行 测试 ， 这 是 
FPCA 设计 中 常用 的 技术 。 


11.11.1 加 快 投 片 的 准备 


利用 FPCA， 我 们 能 快速 地 得 到 电路 板 级 的 初步 设计 。 在 电路 板 级 的 系统 测 
试 中 能 发 现 用 RIL 仿真 无 法 检测 到 的 错误 。 想 要 验证 设计 是 否 正 确 ， 必 须 将 硬 
件 检查 与 仿真 结合 起 来 。 在 FPGA 设计 的 初期 ， 通 过 仿真 可 发 现 设计 中 存在 的 绝 
大 部 分 问题 ， 所 以 此 时 仿真 最 有 价值 ， 而 在 调试 接口 和 驱动 程序 时 ， 人 硬件 检验 非 
常 有 用 。 
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11. 12 ”功能 验证 清单 


1. 编写 测试 计划 ， 其 中 应 包括 能 证 明 设 计 正确 无 误 的 重要 测试 案例 的 每 个 
细节 。 

2 编写 功能 履 盖 度 测试 说 明 书 ， 其 中 应 该 定义 功能 覆盖 的 测试 范围 。 

3. 搭建 系统 测试 平台 。 

4. 编写 功能 测试 模块 ， 并 进行 仿真 ， 以 期 获得 功能 测试 的 覆盖 度 。 

5. 进行 代码 覆盖 度 测试 ， 只 有 在 RTL 代码 稳定 之 后 才能 进行 这 项 测试 。 

6. 实现 彻底 的 功能 覆盖 测试 ， 如 果 设 计 模 块 的 功能 测试 覆盖 率 达 到 100% ， 


就 应 该 扩展 到 系统 级 的 功能 覆盖 测试 。 

7. 对 IP 进行 图 形 界面 测试 。 

8. 对 具有 标准 接口 协议 的 卫 ， 必 须 完 成 硬件 互 操作 性 测试 。 

9. 执行 系统 调试 。 这 次 调试 需要 将 软件 下 载 到 目标 人 硬件 上 ， 执 行 软 / 便 件 协 
同 仿真 ， 以 验证 软件 与 硬件 能 很 好 地 配合 ， 正 确 无 误 地 运行 。 
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12.1 时 序 收敛 的 难点 


FPGA 设计 流程 中 ， 时 序 收敛 是 设计 师 最 易 产生 挫折 感 的 阶段 。 时 序 收敛 有 
可 能 耗 尽 EDA 工作 站 的 机 时 。 即 便 如 此 ， 设 计 的 性 能 如 仍 不 能 达标 ， 设 计 师 就 
不 得 不 选用 速度 等 级 更 高 的 FPGA 器 件 ， 从 而 造成 开发 经 费 超 标 。 

本 书 中 的 大 部 分 草 闻 都 是 围绕 着 如 何在 设计 中 克服 困难 ， 达 到 时 序 收敛 的 目 
标 而 展开 。 

在 进入 到 下 一 个 阶段 的 讨论 之 前 ， 本 章 先 介绍 达到 时 序 收敛 目标 的 设计 方 
法 。 

为 什么 说 在 FPGA 设计 中 达到 时 序 收敛 目标 是 一 项 艰巨 的 任务 呢 ? 

在 过 去 十 年 间 里 ，FPGA 器 件 的 密度 和 面向 FPCA 咒 件 的 设计 规模 都 有 巨大 
的 增长 。FPGA 器 件 的 逻辑 密度 增长 了 约 30 倍 ， 艇 入 存储 咒 的 数量 增加 了 约 70 
音 。 然 而 在 同时 期 内 ， 工 作 站 CPU 的 速度 却 只 增加 了 14 倍 。 以 上 这 些 因 素 就 造 
成 了 高 密度 FPGA 设计 的 编译 时 间 过 长 。 

除 此 之 外 ， 设 计 的 时 钟 速度 和 接口 速度 都 有 显著 地 提升 。 目 前 FPCA 带 件 中 
收发 融 的 速度 超过 了 11C，DDR3 内 存 接口 的 运行 速度 超过 了 533MHz。 

这 些 类 型 的 应 用 要 求 更 复杂 的 时 序 约束 ， 例 如 源 同步 接口 和 跨 时 钟 传输 。 

最 新 的 FPCA 器 件 工艺 尺寸 小 ， 为 达到 时 序 收敛 的 目标 ， 要 求 时 序 分 析 在 两 
个 或 多 个 时 序 的 边 角 条 件 下 进行 。 对 这 些 工艺 尺寸 小 的 FPGA， 在 延迟 中 占 主导 
的 通常 是 互 连 线 延迟 ， 而 不 是 逻辑 单元 延迟 。 在 避免 布线 拥塞 的 同时 还 要 避免 见 
长 的 互 连 延迟 ， 这 就 给 FPGA 设计 的 布局 带 来 了 困难 。 

添加 专用 的 硬件 模块 ， 如 验 和 式 存 储 器 和 DSP 模块 ， 带 来 的 好 处 是 增强 了 
功能 ， 但 如 何 安置 与 这 些 模块 接口 的 相关 逻辑 也 是 个 难题 。 

值得 庆幸 的 是 ，FPCA 厂商 所 提供 的 软件 中 包含 了 很 多 个 功能 项 来 解决 
这 些 困 难 。 在 多 数 情况 下 ， 默 认 设 置 就 能 满足 设计 的 性 能 指标 。 对 那些 按 默 
认 设 置 不 能 满足 指标 的 设计 ， 设 计 师 可 以 借助 众多 的 分 析 工 具 和 功能 项 使 设 
计 达 到 要 求 。 
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12.2 时 序 分 配 和 时 序 分 析 的 重要 性 


在 提 到 时 序 收敛 时 ， 时 序 分 析 是 设计 师 必须 理解 的 唯一 的 最 重要 问题 ， 也 是 
最 不 容易 理解 的 地 方 。 

本 革 这 一 节 将 说 明 时 序 分 析 的 重要 性 ， 并 且 给 出 时 序 分 析 的 基本 背景 。 深 入 
的 时 序 分 析 本 身 就 可 以 写 一 部 书 。 为 了 更 好 地 理解 时 序 分 析 ， 建 议 设计 师 参 加 
FPCA 厂商 的 培训 ， 并 且 从 它们 的 网 站 下 载 各 种 操作 说 明 书 。 

时 序 分 配 在 FPGA 设计 中 有 如 下 两 个 作用 : 

1. 指导 综合 工具 进行 布局 布线 工作 。 时 序 分 配对 布局 布线 的 影响 将 在 
12.3.4.1 节 “ 认 识 布局 布线 工具 ”中 详细 介绍 。 时 序 分 配 告诉 综合 器 应 该 把 优 
化 的 重点 放 在 哪里 ， 并 命令 布局 布线 工具 ， 优 先 考虑 那 几 条 路 径 的 布局 和 布线 。 

2. 用 于 时 序 分 析 。 时 序 分 析 并 不 保证 RTL 设计 功能 的 正确 性 ， 只 保证 设计 
没有 时 序 冲突 。 静 态 时 序 分 析 通 过 计算 得 到 设计 时 序 ， 并 没有 进行 仿真 。 


12.2.1 时 序 分 析 的 背景 


回顾 过 去 ，FPCA 设计 流程 中 的 时 序 分 析 曾 经 比较 简单 。 当 时 由 于 终极 应 用 
相当 简单 ， 时 钟 域 的 个 数 有 限 ， 而 从 厂商 那里 得 到 的 时 序 模型 又 设置 了 超大 的 保 
护 带 ， 因 而 设计 师 只 需 在 一 个 时 序 边 角 条 件 上 分 析 设计 就 足够 了 。 每 个 FPCA 厂 
商 主要 针对 时 钟 频率 ， 创 建 了 它们 自己 的 时 序 分 配 语言 。 这 样 就 有 效 地 庇护 了 设 
计 师 ， 使 得 他 们 无 需 知道 时 序 分 析 的 复杂 性 。 

对 于 当今 这 类 面向 FPGA 器 件 的 设计 ， 设 计 师 在 时 序 分 析 上 面临 的 困难 和 
ASIC 设计 师 多 年 来 面临 的 困难 相同 。 如 今 典型 的 FPCA 设计 通常 使 用 多 个 时 钟 
域 ， 时 钟 域 之 间 又 有 复杂 的 关系 ， 因 而 需要 特别 注意 接口 时 序 ， 而 不 是 只 是 单纯 
地 找到 最 高 的 时 钟 频率 。 对 于 最 新 的 65nm 和 45nm 工艺 ,为 了 保证 FPGA 设计 
的 正常 运行 ， 必 须 在 多 个 时 序 的 边 角 条 件 下 进行 时 序 分 析 。 由 于 最 初 的 时 序 分 析 
语言 不 是 用 来 约束 这 类 FPGA 设计 的 时 序 的 ， 这 就 要 求 FPGA 设计 师 必须 学 习 
ASIC 的 时 序 分 析 技 术 。 

值得 庆幸 的 是 ，FPCA 厂商 和 EDA 工具 行业 正在 标准 化 来 自 Synopsys 的 SDC 
(Synopsys Design Constraints) 时 序 约束 语言 。 


12.2.2 时 序 分析 基础 


本 节 除 了 简单 描述 构建 时 序 分 析 的 初级 时 序 约束 之 外 ， 还 要 解释 在 时 序 分 析 
中 使 用 到 的 通用 术语 。 
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12.2.2.1 静态 时 序 分 析 

静态 时 序 分 析 估 算 设 计 中 时 序 路 径 的 时 延 ， 并 对 照 设置 的 时 序 约 束 ， 报 告 映 
射 后 实现 电路 的 时 序 。 基 于 FPGA 硅 片 的 时 序 特性 ， 静 态 时 序 分 析 能 确定 设计 是 
否 能 正常 运行 。 时 序 分 析 与 输入 的 功能 无 关 ， 它 依据 时 序 要 求 ， 遍 及 分 析 设计 中 
所 有 输入 和 器 件 中 每 条 路 径 可 能 的 组 合 ， 从 定 电路 的 延迟 。 

与 门 级 仿真 和 电路 板 测 斌 比较， 静态 时 域 分 析 能 更 快 更 容易 地 发 现 与 时 序 有 
关 的 错误 。 
12.2.2.2 设计 约束 (SDC) 

SDC 是 Synopsys Design Constraints 的 缩写 。 它 是 针对 时 序 约束 的 行业 标准 语 
言 ， 已 为 大 多 数 FPGA 厂商 和 支持 FPCA 器 件 的 EDA 工具 所 采纳 。 
12.2.2.3 时 钟 

时 钟 被 用 于 触发 寄存 吾 到 寄存 器 的 同步 传输 ， 引 导 毕 合 和 布局 布线 工具 实现 
优化 算法 ， 以 达到 最 好 的 设计 效果 。 

在 任何 设计 的 约束 (SDC) 文件 中 ， 应 该 首先 确定 时 钟 约束 。 时 钟 约束 之 所 
以 重要 是 由 于 很 多 约束 都 需要 有 参照 时 钟 才 能 执行 ; 因此 必须 最 先 定义 时 钟 约 
束 。 
12.2.2.4 发 送 沿 

发 送 沿 是 从 寄存 内 (时 序 元 件 ) 发 出 数据 时 使 用 的 有 效 时 钟 沿 。 例 如 寄存 
器 作为 数据 发 送 端 时 就 要 使 用 该 触发 沿 。 
12.2.2.5 锁 存 沿 

锁 存 沿 是 在 时 序 元 件 的 数据 输入 端 捕 获 数据 时 使 用 的 有 效 时 钟 沿 。 例 如 寄存 
融 作 为 数据 接收 端 时 就 要 使 用 锁 存 沿 。 

发 送 沿 和 锁 存 沿 的 关系 ， 如 图 12-1 所 示 。 


ck regl reg2 


数据 发 送 寄 存 器 reg1 的 发 送 沿 “数据 接收 寄存 器 reg2 的 锁 存 沿 


到 12-1 发 送 沿 和 锁 存 沿 关系 示意 图 
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12.2.2.6 保持 时 间 (4,) 

为 了 让 某 个 数据 存 人 寄存 器 ， 在 触发 该 寄存 器 的 有 效 时 钟 治 到 达 其 时 钟 引 脚 
后 ， 该 数据 必须 继续 在 寄存 器 的 输入 《〈 或 者 使 能 输入 ) 端口 保持 一 段 时 间 不 发 
生变 化 ， 才 能 确保 该 数据 准确 地 存 人 寄存 器 。 数 据 在 寄存 器 输入 端 必 须 继 续 保 持 
不 变 的 最 短 时 间 就 是 4 (保持 时 间 )。 

寄存 器 (时序 元 件 ) 的 有 效 触发 时 钟 沿 到 来 之 后 ， 输 入 信号 变化 太 快 会 造 
成 保持 时 间 不 够 ， 从 而 导致 寄存 器 〈 时 序 元 件 ) 输出 时 序 混乱 。 
12.2.2.7 建立 时 间 (1,,) 

为 了 让 某 个 数据 存 信 寄存器， 在 触发 该 寄存 器 的 有 效 时 钟 治 到 达 其 时 钟 引 脚 
之 前 ， 该 数据 必须 在 寄存 器 的 输入 〈 或 者 使 能 输入 ) 端口 已 保持 了 一 段 时 间 不 
发 生变 化 ， 才 能 确保 该 数据 准确 地 存 信 寄存器。 数据 在 寄存 器 输入 端 必须 已 保持 
不 变 的 最 短 时 间 就 是 1,，( 建 立时 间 )。 
建立 时 间 和 保持 时 间 的 关系 ， 如 图 12-2 所 示 。 

寄存 器 寄存 器 


D D 


输入 数据 


>» 
输出 数据 
源 时 钟 王 2 一 一 一 一 一 一 


目的 时 名 
: 建立 时 间 一 -一 
> 保持 时 间 --- 一 
0 10 20 | 30 


罗 12-2 建立 时 间 和 保持 时 间 示 意图 


当 信和 号 到 达 寄 存 器 (时序 元 件 ) 的 输入 端 过 晚 ， 错过 了 它 应 该 传 到 下 一 级 
寄存 器 的 时 间 〈 这 里 时 间 是 指 下 一 级 触发 器 的 触发 时 钟 沿 到 达 时 刻 ) ， 就 会 出 现 
建立 时 间 不 够 的 时 序 冲突 。 建 立时 间 不 够 会 导致 寄存 器 (时序 元 件 ) 时 序 混乱 。 
12.2.2.8 到 达 时 间 

到 达 时 间 可 分 为 数据 到 达 时 间 和 时 钟 到 达 时 间 。 

数据 到 达 时 间 指 的 是 数据 从 源 时 钟 到 目的 寄存 器 (数据 输入 端 ) 的 延迟 。 

时 钟 到 达 时 间 指 的 是 从 目的 时 钟 节 点 到 的 目的 寄存 器 (时钟 输 入 端的 延 
述 。 

数据 到 达 时 间 和 时 钟 到 达 时 间 的 关系 ， 如 图 12-3 所 示 。 
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| 数据 到 达 _ 
ER >! 7 二 
[> 一 | 
Ep 时 名 到 达 


到 12-3 ”时 钟 到 达 和 数据 到 达 示 意图 


12.2.2.9 时 序 要 求 

时 序 要 求 是 指 在 不 延长 设 定 的 时 钟 周 期 的 前 提 下 ， 对 信号 最 晚 必 须 到 达 时 间 
的 要 求 。 
12. 2.2. 10 ”时 间 裕 量 

时 间 裕 量 是 指 满足 或 不 满足 时 序 要 求 时 所 留 有 的 裕 度 。 它 是 要 求 〈 信 和 号 ) 
到 达 的 时 间 和 信号) 实际 到 达 时 间 的 差 值 。 正 裕 量 是 满足 时 序 要 求 时 ， 还 留 
有 的 余地 。 而 负 裕 量 则 是 在 不 满足 时 序 要 求 时 ， 与 时 序 要 求 间 的 差距 。 
12.2.2.11 时 序 异常 

原本 不 需要 时 序 异 常 这 个 约束 ， 然 而 为 了 更 好 地 描述 设计 如 何 运 行 ， 添 加 了 
时 序 异 常 这 个 约束 。 时 序 蜡 常 可 调整 如 何 对 设计 进行 时 序 分 析 。 多 周期 路 径 和 伪 
路 径 是 时 序 异 常 的 具体 实例 。 
12.2.2.12 多 周期 路 径 

信号 更 新 的 时 间 超过 一 个 时 钟 周期 就 是 多 周期 路 径 。 这 些 路 径 需 要 由 模块 的 
设计 师 来 确定 ， 确 定 哪 几 条 路 径 为 多 周期 路 径 ， 需 要 对 设计 的 功能 有 透彻 地 了 解 。 

分 配 多 周期 路 径 ， 就 是 允许 设计 师 指 定数 值 ， 锁 定 到 目的 寄存 器 之 前 需要 等 
待 的 时 钟 周期 个 数 。 因 此 ， 目 的 寄存 器 就 能 在 某 个 准确 的 时 钟 沿 到 来 的 时 刻 锁 定 
该 数值 。 

图 124 详细 说 明了 所 需要 时 钟 个 数 为 2 时 ， 多 周期 路 径 下 的 数值 寄存 。 数 
值 锁 存 触发 沿 比 单 周 期 路 径 延 迟 了 一 个 目的 时 钟 周期 。 


新 建立 时 间 一 一 
默认 建立 时 间 ----~ 


图 124 多 周期 路 径 
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12.2.2.13 伪 路 径 

盆 路 径 分 配 ， 用 来 明确 指出 哪些 路 径 不 需要 进行 时 序 分 析 。 例 如 测试 逻辑 或 
所 有 与 电路 运行 无 关 的 路 径 都 不 需要 进行 时 序 分 析 ， 因 此 设计 者 必须 把 这 些 路 径 
明确 地 指定 为 伪 路 径 。 跨 时 钟 域 的 路 径 通常 被 指定 为 伪 路 径 。 
12.2.2.14 源 同步 

源 时 钟 同步 是 用 于 描述 时 钟 和 数据 同 源 的 技术 。 在 源 同 步 接 口中 ， 时 钟 源 与 
数据 源 使 用 同一 设备 。 
12.2.2.15 上 升 /下 降 时 间 

上 升 时 间 是 指 信号 值 从 低 变 到 高 所 需 的 时 间 。 低 值 通常 是 信号 值 的 10% ， 
而 高 值 为 信号 值 的 90% 。 下 降 时 间 是 指 信 号 值 从 高 变 到 低 所 需 的 时 间 。 
12. 2. 2. 16 输入 延迟 

输入 延迟 (建立 输入 _ 延迟) 规定 了 在 指定 的 输入 端口 相对 于 时 钟 所 要 求 
的 数据 到 达 时 间 。 输 入 延迟 规定 中 的 相对 于 时 钟 是 指 相对 于 该 时 钟 的 上 升 沿 或 者 
下 降 沿 。( 见 图 12-5 ) 。 


外 部 设备 Altera 设 备 


re 


图 12-5 输入 延迟 
12.2.2.17 输出 延迟 
输出 延迟 (建立 输出 _ 延迟) 规定 了 在 指定 的 输出 端口 相对 于 时 钟 所 要 求 
的 数据 到 达 时 间 。 和 输出 延 玉 规定 中 的 相对 于 时 钟 是 指 相 对 于 该 时 钟 的 上 升 沿 或 下 
降 沿 〈 见 图 12-6 ) 。 


Altera 设 备 外 部 设备 


图 12-6 输出 延迟 
12. 2. 2. 18 ”运行 条 件 
运行 条 件 由 设计 时 序 分 析 期 间 所 使 用 的 电压 设置 与 温度 设置 组 成 。 这 些 设置 
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值 会 影响 时 序 分 析 工 具 所 使 用 时 序 模 型 的 延迟 。 
12.2.2. 19 多 边 角 条 件 分 析 

在 对 设计 进行 静态 时 序 分 析 时 ， 采 用 多 边 角 分 析 可 以 了 解 FPGA 设计 在 不 同 
运行 条 件 下 的 时 序 情况 。 这 种 验证 通常 用 设计 的 最 慢 边 角 模 型 和 最 快 边 角 模 型 分 
两 次 进行 。 

在 完成 时 序 设计 的 签收 之 前 ， 设 计 师 必须 进行 多 个 边 角 条 件 的 时 序 分 析 ， 检 
查 是 否 达 到 时 序 需 求 。 多 年 以 前 ，FPGA 厂商 只 提供 一 个 代表 最 差 运 行 条 件 的 时 
序 模型 。 该 模型 内 部 有 足够 宽 的 时 序 保护 带 ， 因 而 设计 师 只 需要 用 一 个 时 序 模型 
就 可 以 完成 时 序 分 析 ， 还 能 保证 设计 的 时 序 符合 要 求 。 随 着 FPGA 器 件 工艺 尺寸 
缩小 到 65nm、40nm 以 下 ， 这 种 做 法 就 不 再 符合 实际 了 。 设 计 师 必须 在 最 好 和 最 
坏 的 条 件 下 分 别 对 设计 做 时 序 分 析 ， 待 时 序 达 到 需求 后 ， 才 能 签收 。 也 就 是 设计 
师 必须 分 别针 对 最 好 和 最 坏 两 种 运行 条 件 对 设计 时 序 进 行 优化 。 
12.2. 2.20 慢 边 角 条 件 模型 

慢 边 角 条 件 时 序 模型 表示 在 最 差 的 运行 条 件 下 ， 任 何 单条 路 径 可 能 的 最 慢性 
能 。 该 模型 表示 在 最 高 运行 温度 和 最 低 电 压 (VCCMIN) 下 器 件 的 最 慢 行为 。 通 
常 慢 时 序 模型 用 于 检查 建立 时 间 是 否 能 满足 需求 。 
12.2.2.21 快 边 角 条 件 模型 

快 边 角 条 件 时 序 模型 表示 在 最 好 的 运行 条 件 下 ， 任 何 单条 路 径 可 能 的 最 快 性 
能 。 

该 模型 表示 在 最 低 运 行 温度 和 最 高 电压 (VCCMAX) 下 器 件 的 最 快 行为 。 
通常 快 时 序 模型 用 于 检查 保持 时 间 是 否 能 满足 需求 。 

在 最 好 的 运行 条 件 下 ， 短 路 径 的 是 否 满足 时 序 要 求 可 以 用 这 种 分 析 来 验证 。 
12. 2. 2. 22 时钟 的 不 确定 性 

时 钟 的 不 确定 性 通常 是 指 时 钟 或 时 钟 到 时 钟 传输 的 偏 任 。 时 钟 的 不 确定 性 可 
分 为 建立 时 钟 的 不 确定 性 和 保持 时 钟 的 不 确定 性 ， 还 可 分 为 时 钟 正 跳 变 沿 的 不 确 
定性 和 时 钟 负 跳 变 沿 的 不 确定 性 〈 见 图 12-7 ) 。 


0 负 10 

时 钟 建立 的 不 确定 性 
一 -~ 有 不 确定 性 的 建立 关系 
无 不 确定 性 的 建立 关系 


图 12-7 ”时钟 的 不 确定 性 


12. 2. 2. 23 ”时钟 延迟 
有 两 种 类 型 的 时 钟 延 迟 : 网 络 延迟 和 源 延 退 。 网 络 延迟 是 指 时 钟 网 络 上 时 钟 
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和 寄存 器 时 钟 引 脚 之 间 的 延迟 。 
源 延 迟 是 时 钟 和 时 钟 源 (如 系统 时 钟 或 产生 时 钟 的 基 时 钟 ) 之 间 的 时 钟 网 
络 延迟 。 
当时 钟 输 入 端口 被 用 作 反 馈 时 钟 时 ， 为 清晰 表示 从 时 钟 输出 端口 到 时 钟 输入 
端口 的 电路 板 级 延迟 ， 源 延迟 可 以 被 分 配给 所 产生 的 时 钟 。 


12.3 ”实现 时 序 收敛 目标 的 方法 学 


这 一 节 将 描述 在 FPGA 设计 中 总 能 让 设计 师 达 到 时 序 收敛 目标 的 设计 方法 


2 
12.3.1 指定 FPGA 器 件 系列 


12.3.1.1 选择 速度 等 级 

为 了 能 很 快 地 实现 时 序 收敛 的 目标 ， 建 议 在 设计 之 初 就 选用 速度 等 级 最 高 的 
FPGA 器 件 来 实现 设计 。 这 样 就 能 更 快 地 转 人 电路 板 功能 验证 阶段 ， 并 能 更 快 地 
开始 软件 的 开发 。 

设计 师 可 以 在 验证 周期 中 或 功能 验证 完成 后 ， 再 转 用 低速 FPGA 器 件 ， 对 设 
计 进 行 优化 。 
12.3.1.2 设置 IO 

设计 师 对 驱动 强度 和 170 标准 的 选择 会 影响 引 脚 的 时 序 。 它 们 也 会 影响 所 选 
器 件 的 功 耗 和 信和 号 的 完整 性 。 

以 下 是 可 以 用 来 改善 YO 时 序 的 技术 ， 按 优先 顺序 排列 如 下 : 

1. 确保 给 YO 引 脚 设置 恰当 的 时 序 约束 。 

2. 检查 报告 文件 ， 确 定 是 否 使 用 了 LO 寄存器。 如果 没有 使 用 IO 寄存 器 ， 
就 需要 查看 RTL 代码 ， 并 重新 编写 RTL 代码 令 输 出 寄存 器 驱动 引 脚 ， 且 令 引 脚 
驱动 输入 寄存 器 。 为 了 满足 WO 的 时 序 要 求 ， 布 局 布线 软件 通常 会 自动 使 用 IO 
寄存 器 。 若 确实 没有 使 用 IO 寄存 器 ， 则 设计 师 可 以 通过 FPGA 设计 软件 的 设置 
项 ， 强 行 令 布 局 布线 软件 使 用 IO 寄存 器 。 

3. 关注 VO 单元 的 延迟 链 设置 。 对 于 引 脚 之 间 的 连接 ， 无 论 输 入 或 输出 引 
脚 都 要 使 用 最 短 延 迟 。 大 多 数 FPGA 器 件 的 IO 单元 具有 可 编程 的 延迟 选项 ， 用 
以 最 小 化 志和 如 〈 建 立 和 保持 总 时 间 ) 时 间 。 这 些 延 迟 通常 由 FPCGA 设计 软件 
根据 ZO 时 序 设 置 自动 设 定 。 若 自动 设 定 延 迟 没 有 起 作用 ， 则 设计 师 可 以 通过 软 
件 中 的 设置 项 ， 手 动 设 定 。 

4. 移动 锁 相 环 时钟 沿 。 来 满足 IO 的 时 序 要 求 如 果 锁 相 环 为 驱动 VO 引 脚 
的 寄存 器 或 IO 引 脚 的 输入 寄存 器 提供 时 钟 ， 就 可 以 对 锁 相 环 的 输出 进行 相 移 以 
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改变 0 的 时 序 。 后 移 锁 相 环 时 钟 以 缩短 建立 时 间 i 为 代价 从 而 提供 更 富裕 的 
i。( 建立 和 保持 总 时 间 )。 前 移 锁 相 环 锁 相 环 时 钟 以 缩短 i。, 和 保持 时 间 为 代 
价 ， 从 而 提供 更 富裕 的 建立 时 间 i,,。 


12.3.2 设计 规划 


第 8 章 所 提 到 的 那样 ， 对 时 序 收敛 进行 预先 规划 非常 重要 。 预 完 规划 会 有 助 
于 在 问题 出 现 之 前 发 现 问题 ， 并 避免 延误 设计 周期 。 

所 有 的 RIL 代码 都 编写 完 后 ， 才 去 编译 顶层 设计 是 时 序 收敛 中 常见 的 误区 
之 一 。 为 了 尽早 发 现 设计 集成 和 资源 使 用 中 的 问题 ， 设 计 师 应 该 每 完成 一 个 主要 
的 低层 次 模块 RTL 编码 ， 就 即刻 对 顶层 设计 进行 一 次 编译 。 

为 了 实现 顶层 设计 的 时 序 收敛 目标 ,设计 师 需 要 在 设计 说 明 书 阶段 ， 即 定义 
如 何 划 分 功能 模块 时 就 要 开始 考虑 时 序 收敛 问题 。 时 序 收敛 计划 包含 单个 模块 的 
时 序 要求 、 模 块 间 的 时 序 要 求 ， 以 及 对 所 有 与 专用 硬件 模块 或 器 件 引 脚 接口 的 模 
块 布局 的 约束 。 在 编译 顶层 RTL 代码 时 需要 遵循 这 些 规定 。 关 于 RTL 设计 划分 
的 更 多 详细 信息 见 8.5.2.3 节 。 

这 里 还 是 要 建议 设计 师 使 用 增 量 设计 方法 。 在 实际 设计 中 ， 通 过 如 8. 5. 2.3 
所 述 的 合理 设计 划分 ， 实 际 上 已 经 为 使 用 增 量 编译 法 进行 设计 做 好 了 准备 。 对 
FPCA 设计 而 言 ， 这 种 方法 的 优势 在 于 把 它 应 用 到 基于 团队 的 设计 方法 中 十 分 容 
易 。 这 样 ， 很 多 位 工程 师 可 以 一 起 做 同一 个 FPCA 设计 ， 轻 松 地 达到 时 序 收敛 的 
目标 。 这 种 设计 方法 可 以 使 设计 修改 〈 即 修改 工程 指令 ) 的 次 数 减 至 最 少 ， 从 
而 减少 对 设计 造成 的 影响 。 

主流 FPGA 厂商 和 EDA 供应 商 所 提供 的 FPCA 设计 软件 都 支持 增 量 设计 方 
法 学 。 

12. 3.2.1 增 量 编译 

正如 之 前 所 提 到 的 那样 ， 源 自 FPGA 厂商 的 增 量 编译 功能 可 以 大 大 地 缩短 编 
译 时 间 ， 但 这 不 是 该 方法 的 唯一 优势 。 增 量 编译 方法 还 能 缩短 实现 时 序 收敛 目标 
的 时 间 。 使 增 量 编译 产生 效益 的 关键 因素 是 良好 的 设计 规划 。 

那么 ， 增 量 编译 是 如 何 工作 的 呢 ? 

增 量 编译 不 编译 设计 中 无 变动 的 模块 ， 只 编译 设计 中 有 改动 的 那 部 分 模块 。 
由 于 需要 重新 编译 的 逻辑 减少 了 ， 编 译 的 工作 量 也 就 减少 了 ， 因 而 增 量 编译 的 最 
大 好 处 是 缩短 编译 时 间 。 第 二 个 好 处 是 一 旦 设计 中 时 序 临 界 的 模块 满足 了 时 序 需 
求 ， 设 计 师 就 可 以 对 它 进 行 锁 定 ， 这 些 模块 的 性 能 就 会 在 整个 设计 中 得 到 保持 。 
而 通常 被 忽略 的 第 三 个 好 处 是 设计 师 在 加 入 调试 逻辑 进行 调试 时 ,使 用 增 量 编 译 
不 会 影响 设计 的 性 能 。 这 一 点 将 在 第 十 三 章 中 更 详细 地 讨论 。 

综 上 所 述 ， 设 计 师 应 该 采用 增 量 设计 的 方法 。 
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然而 设计 师 也 应 意识 到 增 量 设计 法 在 设计 应 用 中 的 限制 ， 以 避免 一 些 易 犯 的 
错误 。 这 些 限制 如 下 : 

1. 它 需 要 事先 规划 设计 分 区 ， 如 8. 5. 2.3 节 所 述 。 这 对 设计 模块 如 何 接口 
就 有 了 限制 。 

2. 它 妨 碍 了 跨 模 块 的 优化 。 该 限制 可 以 通过 以 下 方法 来 解决 : 保持 设计 模 
块 中 的 关键 路 径 ; 寄存 设计 模块 的 端口 信号 ; 不 要 在 下 一 层 设计 模块 间 插 入 组 合 
逻辑 。 

3. 它 降低 了 应 能 达到 的 器 件 利用 率 。 有 些 FPGA 设计 软件 在 对 完整 设计 进 
行 面 积 优化 时 确实 比较 有 效 。 例 如 ， 为 节省 面积 ， 面 积 优化 工具 可 把 表示 组 合 
逻辑 的 查找 表 (LUT) 与 该 组 合 逻 辑 无 关 的 寄存 器 布 在 同一 个 逻辑 单元 中 。 若 
设计 师 想 要 在 设计 中 充分 利用 每 个 逻辑 单元 中 的 每 个 基本 元 件 ， 但 由 于 FPCA 
器 件 中 可 用 布线 资源 分 配 的 缘故 ， 设 计 师 很 可 能 无 法 实现 时 序 收 敛 的 目标 。 为 
了 实现 设计 的 时 序 收敛 和 高 性 能 目标 ， 有 时 必须 牺牲 FPCA 器 件 的 利用 率 ， 决 
定 设计 选用 哪 一 种 规格 的 FPGA ， 应 在 设计 说 明 书 中 明确 地 加 以 说 明 。 使 用 增 
量 设 计 方 法 ， 可 使 大 多 数 设计 达到 85% 以 上 的 逻辑 利用 率 ， 同 时 实现 时 序 收 
敛 的 目标 。 

自 顶 向 下 的 设计 流程 

在 自 项 向 下 的 设计 流程 中 ， 整 个 设计 在 一 个 工程 中 进行 编译 ， 并 针对 整个 设 
计 进 行 时 序 收敛 。 当 设计 中 不 同 模 块 的 RTL 代码 完成 后 ， 它 们 被 添加 到 顶层 设 
计 并 和 设计 的 其 余部 分 一 起 编译 。 使 用 这 种 技术 的 优势 之 一 是 对 分 区 之 间 的 路 径 
提供 了 良好 的 能 见 度 。 时 序 收敛 是 针对 整个 设计 进行 的 。 一 旦 设计 师 对 所 设计 模 
块 的 结果 满意 ， 这 个 模块 就 被 锁定 ， 再 也 不 需要 被 重新 编译 ， 从 而 在 缩短 编译 时 
间 的 同时 锁定 了 性 能 。 

自 底 向 上 的 设计 流程 

在 自 底 向 上 的 设计 流程 中 ， 各 模块 在 单独 的 工程 中 进行 编译 ， 一 旦 模块 达 时 
序 收敛 目标 ， 就 立即 被 锁定 。 低 层 分 区 在 最 后 集成 时 移植 到 顶层 工程 中 。 这 样 设 
计 不 需要 被 重新 编译 ， 但 需要 融合 所 有 模块 的 布局 布线 网 表 ， 然 后 通过 布线 操作 
连接 所 有 的 模块 〈 见 图 12-8 ) 。 

自 底 向 上 的 设计 流程 在 不 同 团队 成 员 间 存在 简单 的 设计 分 区 时 有 帮助 ， 
但 缺点 是 完全 隔离 了 低层 模块 。 它 要 求 事先 对 芯片 的 资源 分 配 花 更 多 的 功 
夫 。 为 适应 每 个 模块 在 独立 的 工程 中 进行 编译 ， 还 需要 进行 详细 的 版 图 规 
划 。 它 也 使 得 整个 项 目的 时 序 约束 更 为 复杂 ， 因 为 时 序 约束 需要 由 顶层 工程 
传递 到 低层 工程 中 。 任 何 需要 在 低层 工程 中 添加 的 时 序 约束 也 必须 移植 到 项 
层 工程 中 〈 见 图 12-9 ) 。 
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图 12-8 自 底 向 上 的 设计 流程 
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图 12-9 ”顶层 设计 中 的 模块 集成 


12. 3. 2.2 增 量 编译 使 用 场合 介绍 

本 节 中 ， 我 们 将 关注 几 个 使 用 增 量 编 译 能 显著 缩短 时 序 收敛 周期 的 场合 

图 12-10 re 个 能 进行 增 量 编译 的 设计 分 区 。 

为 了 进行 增 量 编译 ， 该 设计 规划 将 设计 划分 为 三 个 主要 的 层次 : “动作 ” 
层 、 “控制 ” ， “顶层 ”。 顶 层 是 设计 的 最 高 层次 ， 含 “动作 ”模块 、“ 控 制 ” 
模块 和 其 他 层次 。“ 动作 ”模块 进一步 地 分 层 ， 含有 两 个 其 他 的 设计 层次 。 “ 控 
制 ” 模 块 是 顶层 设计 模块 之 一 “解码 器 ”单元 的 一 个 子 集 。 这 个 设计 已 经 被 编 
译 并 达到 了 性 能 要 求 。 

场合 1: 参数 微调 

在 本 场合 中 ， 由 于 设计 说 明 书 中 一 个 小 变动 ， 系 统 需 要 做 一 些微 调 ， 会 影响 
顶层 文件 中 的 存储 模块 ， 当 “动作 ”模块 和 “控制 ”模块 的 RTL 代码 不 再 改变 
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控制 器 | | 卫 核 | 时 序 紧张 ” | 控制 器 


图 12-10 ”为 进行 增 量 编译 的 设计 分 区 示例 


时 ， 设 计 师 便 可 以 将 它们 的 布局 布线 锁定 。 需 要 改变 的 只 剩 下 “存储 ”模块 ， 
此 时 只 需 重新 编译 项 层 模块 即 可 。 由 于 “动作 ”模块 和 “控制 ”模块 不 需要 再 
次 编译 ， 它 们 的 性 能 就 不 会 改变 。 这 样 只 有 75% 的 设计 需要 重新 编译 ， 也 没有 
触及 布局 布线 有 困难 的 时 序 临 界 的 模块 ， 因 而 编译 时 间 大 大 缩短 了 。 

通常 可 在 6 个 小 时 内 完成 编译 的 设计 ， 重 新 进行 一 次 完整 的 编译 意味 着 设计 
师 只 能 在 一 个 正常 的 工作 日 内 完成 一 次 设计 迭代。 也 就 是 一 次 迭代 只 能 完成 一 次 
设计 更 改 。 

而 使 用 增 量 编译 的 方法 ， 编 译 时 间 可 以 降 到 不 足 4 个 小 时 ,在 一 天 内 就 可 能 
完成 两 次 设计 和 迭代 。 若 这 些 部 分 设计 的 时 序 不 临界 ， 则 设计 师 可 以 使 用 12. 3.3 
节 介 绍 的 早期 时 序 估算 中 所 描述 的 快速 编译 选项 ， 那 么 在 一 天 内 就 可 完成 更 多 次 
设计 和 迭代 。 

场合 2: 故障 修复 

在 本 场合 中 ， 大 设计 已 完成 ， 设 计 师 正在 实验 室 中 对 设计 进行 最 后 阶段 的 系 
统 在 线 测 试 。 系 统 正在 高 速 地 运行 ， 设 计 师 突然 发 现 一 个 功能 故 隐 ， 他 必须 尽快 
找 出 故障 的 原因 ， 并 及 时 修复 。 

设计 师 利 用 FPGA 厂商 提供 的 一 些 可 用 的 调试 选项 ， 可 以 保护 整个 设计 的 布 
局 布线 ， 而 无 需 再 做 一 次 完整 的 编译 。 

设计 师 可 将 设计 中 的 内 部 信号 快速 地 连接 到 未 使 用 的 引 脚 上 ， 而 不 会 干扰 设 
计 的 布局 布线 。 

设计 师 可 添加 FPGA 厂商 提供 的 舱 入 式 逻 辑 分 析 仪 而 无 须 对 “顶层 ”模块 、 
“动作 ”模块 和 “控制 ”模块 重新 编译 。 如 果 设 计 师 想 隅 离 错误 ， 可 以 完善 误 人 
式 逻 辑 分 析 仪 的 触发 条 件 并 快速 地 创建 一 个 新 的 编程 文件 。 

一 次 完整 的 再 编译 需要 6 个 小 时 并 且 会 改变 设计 的 实现 。 不 使 用 增 量 编译 方 
法 ， 添 加 舱 入 式 逻 辑 分 析 仪 或 者 改变 能 入 式 罗 辑 分 析 仪 可 能 会 导致 原 错 误 消 失 ; 
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设计 师 就 会 疑惑 : 该 设计 的 功能 到 底 是 正确 呢 ? 还 是 不 正确 呢 ? 这 个 问题 会 在 产 
品 中 再 现 吗 ? 

使 用 增 量 编译 功能 ， 设 计 所 实现 的 电路 构造 可 以 得 到 保护 ， 编 译 过 程 大 约 需 
要 花费 45 分 钟 ; 设计 师 可 在 设计 调试 时 进行 多 次 迭代 。 设 计 保 护 可 确保 故障 重 
现 。 

例如 ,设计 师 想 找 到 异步 信号 经 常 出 现 的 冒险 竞争 故障 。 这 种 故障 用 仿真 工 
有 具 很 难 发 现 。 一 旦 在 系统 测试 中 发 现 这 类 错误 ， 设 计 师 必须 正确 地 约束 路 径 ， 并 
重新 编译 受 影响 的 模块 。 
建议 设计 师 只 对 高 速 运行 时 出 现 的 故障 采用 这 种 处 理 方法 。 

场合 3: 时 序 收敛 

在 本 场合 下 ， 为 了 提高 设计 的 整体 性 能 ， 有 必要 考虑 提高 时 序 收敛 的 目标 。 
若 从 第 三 方 得 到 一 个 新 版 本 的 IP 核 ， 则 可 能 需要 考虑 时 序 收敛 。 在 图 12-10 所 
示 的 实例 中 ， 若 必须 使 用 一 个 新 版 本 的 “动作 ” 核 ， 则 设计 说 明 书 也 得 做 相应 
的 改变 ， 模 块 的 性 能 必须 从 120MHz 提高 到 150MHz。 

设计 师 在 编译 某 设 计时 ， 甚 “动作” 核 的 时 序 收敛 目标 无 法 实现 。 由 于 
“动作 ” 核 是 来 自 于 第 三 方 的 加 密 核 ， 设 计 师 没有 任何 办 法 优化 RTL 代码 。 除 了 
等 待 IP 供应 商 提 供 新 版 本 IP 核 外 ， 设 计 师 唯 一 的 选择 就 是 在 FPGA 厂商 提供 的 
软件 中 使 用 高 级 的 优化 设置 。 设 计 师 可 尝试 各 种 设置 ， 直 到 该 “动作 ”IP 核 达 
到 时 序 收敛 的 目标 ， 然 后 锁定 并 保存 该 IP 模块 的 布局 布线 结 

若 其 他 一 些 设计 模块 有 变动 ， 例 如 “顶层 ”模块 的 变动 ， 它 就 不 会 引起 
“动作 ”模块 和 “控制 ”模块 的 时 序 收敛 问题 ， 因 为 它们 已 经 被 锁定 了 。 


12.3.3 早期 时 序 估计 


正如 第 8 章 所 提 到 的 ， 除 非 设 计 已 经 进行 了 一 定 程度 的 布局 ， 否 则 时 序 估计 
并 不 准确 。 因 而 在 设计 早期 ,设计 师 想 通 过 完整 的 布局 布线 编译 得 到 设计 的 性 能 
估计 是 不 可 能 的 。 如 何在 设计 早期 进行 时 序 估计 ，FPGA 厂商 已 给 出 了 解决 方 


案 。 


大 多 数 FPCA 厂商 提供 的 软件 含有 缩短 编译 时 间 的 设置 。 通 过 限制 布局 尝试 
的 次 数 能 大 大 缩短 编译 时 间 ， 这 通常 以 牺牲 设计 的 性 能 为 代价 。 使 用 快速 编译 选 
项 获得 的 时 序 结果 与 使 用 完整 编译 时 所 获得 的 时 序 结果 相 比 ， 通 常 误差 范围 在 
10% 以 内 ， 但 所 用 编译 时 间 却 不 到 一 半 。 这 的 确 是 一 个 能 大 大 缩短 时 序 收 敛 周期 
的 强大 工具 。 
建议 设计 师 在 以 下 的 场合 中 使 用 快速 编译 选项 : 

1. 在 设计 早期 ， 当 设计 师 确定 要 变动 模块 的 性 能 时 使 用 快速 编译 。 所 获得 
的 时 序 结果 可 能 在 最 终结 果 的 10% 误差 以 内 ， 但 迭代 时 间 则 会 短 得 多 。 
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2. 对 容易 满足 时 序 要 求 的 完整 设计 使 用 快速 编译 。 如 果 设 计 相 比 目 标 FPGA 
技术 而 言 性 能 并 不 高 ， 这 种 编译 方式 会 减少 整个 工程 期 内 的 设计 迭代 时 间 。 

工程 文档 应 该 反映 这 个 设计 或 某 一 设计 模块 所 使 用 的 布局 布线 选项 。 

如 果 设 计 的 时 序 差 10% 以 上 才 收 敛 ， 就 应 该 返回 去 修改 RTL 代码 ， 而 不 是 
继续 进行 完整 的 编译 。 

正如 设计 规划 中 所 指出 的 ， 为 了 能 尽早 地 发 现 设 计 集 成 和 资源 利用 中 的 问 
题 ， 设 计 师 应 该 尽早 地 在 顶层 设计 中 编译 主要 的 设计 模块 。 为 了 做 到 这 一 点 ， 设 
计 师 可 以 给 未 完成 的 模块 创建 虚拟 模块 。 但 这 些 空 模块 需要 包含 正确 的 接口 。 


12.3.4 CAD 工具 设置 


建议 设计 师 尽 量 保持 缺 省 的 综合 和 布局 布线 设置 。FPCA 厂商 提供 了 几 十 个 
会 影响 时 序 结果 的 按钮 和 开关 。 设 计时 应 该 尽量 避免 乱 动 它们 ， 只 在 对 RTL 编 
码 已 经 无 能 为 力 时 才 使 用 它们 。 

这 就 是 说 ， 这 些 设 置 会 非常 有 效 并 且 能 大 幅度 地 改变 编译 结果 。 然 而 FPCA 
厂商 所 提供 软件 的 各 个 版 本 给 出 的 时 序 结果 会 截然 不 同 。 因 此 ， 这 些 设置 会 使 设 
计 在 工具 的 各 个 版 本 间 使 用 起 来 不 方便 ， 事 实 上 它们 会 使 所 设计 的 卫 不 可 重用 。 

如 果 设 计 师 走投无路 ， 而 又 不 得 不 惜 任何 代价 达到 时 序 收敛 ， 那么 就 应 该 充 
分 使 用 这 些 选 项 。 

除了 优化 设置 外 ，FPGA 厂商 提供 的 软件 还 能 通过 对 逮 辑 进行 版 图 规划 来 影 
响 时 序 结果 。 设 计 师 可 以 指定 逻辑 单元 放置 在 不 同 的 组 、 区 域 或 者 下 至 个 别 的 布 
线 轨迹 。 

再 次 建议 设计 师 不 要 这 样 做 ， 除 非 FPGA 厂商 提供 的 软件 在 布局 上 做 得 非常 
差 。 

人 类 架构 专家 几乎 不 可 能 用 人 工 方 法 击败 自动 综合 布局 布线 工具 。 然 而 在 个 
别 的 孤立 场合 ， 当 所 有 和 希望 似乎 都 破灭 时 ， 人 工 架 构 方 法 也 不 失 为 设计 师 武 库 中 
的 另 一 种 武器 。 
12.3.4.1 理解 布局 布线 工具 

源 自主 流 FPCA 厂商 的 布局 布线 工具 为 了 满足 设计 需求 会 调整 其 操作 。 换 言 
之 ， 基 于 相同 的 时 序 约束 ， 设 计 师 可 能 得 到 不 同 的 结果 。 时 序 约束 越 严 格 需要 的 
编译 时 间 越 长 。 

布局 布线 工具 是 由 时 序 驱 动 的 ， 因 而 它 能 理解 复杂 的 时 序 约束 。 因 此 建议 设 
计 师 们 使 用 真实 的 时 序 约束 。 

布局 布线 工具 会 努力 寻找 一 个 能 满足 时 序 需 求 的 布局 布线 方案 。 

FPGA 布局 布线 工具 的 特殊 现象 之 一 ， 是 由 其 完成 的 具体 布局 和 连接 时 ， 会 
根据 “种 子 效 应 ”产生 不 同 的 结果 。 
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逻辑 的 初始 布局 是 随机 的 ， 随 设计 的 起 始 条 件 不 同 而 有 所 变化 ， 所 以 有 可 能 
产生 满足 设计 目标 的 不 同 布局 。 布 局 布线 的 种 子 〈 也 叫 适 配器 种 子 ) 可 改变 布 
局 算法 的 起 点 ， 这 会 对 如 何 优 化 的 过 程 产生 影响 。 为 了 实现 时 序 收敛 的 目标 ， 布 
局 布线 算法 会 根据 先前 运行 的 结果 ， 进 行 多 种 布局 尝试 。 然 而 ,初始 布局 的 改变 
可 能 导致 最 终 布局 的 不 同 ， 从 而 产生 不 同 的 时 序 。 

“种 子 扫描 ”是 用 于 时 序 收敛 的 一 项 常用 技术 。“ 种 子 扫描 ”通过 运行 多 个 
不 同 的 种 子 来 确定 哪 一 个 种 子 能 为 设计 带 来 最 好 的 效果 。 过 去 ， 种 子 扫 描 会 导致 
性 能 上 的 大 幅 变 化 。 如 今 ， 种 子 扫描 对 最 新 FPCA 技术 性 能 带 来 的 平均 变化 在 
+5% 的 范围 以 内 。 注 意 对 不 同 的 FPGA 厂商 以 及 不 同 的 器 件 系列 ， 这 种 变化 会 
有 较 大 的 差异 。 

对 于 打算 重用 的 设计 模块 或 者 可 能 要 求 在 今后 进行 更 新 的 最 终 设 计 ， 建 议 设 
计 师 避免 使 用 种 子 扫描 。 这 是 因为 在 FPGA 厂商 所 提供 软件 的 未 来 版 本 中 ， 相 同 
的 种 子 会 带 来 不 同 的 效果 。 再 者 ， 奉 设计 师 对 设计 做 任何 改动 ， 例 如 逻辑 上 的 改 
动 ， 配置 上 的 改动 或 引 脚 上 的 改动 ， 相 同 的 种 子 也 会 带 来 不 同 的 效果 。 

那么 ,什么 时 候 使 用 种 子 呢 ? 

1 如果 设计 能 满足 时 序 ， 设 计 师 还 希望 能 将 设计 的 时 序 裕 量 最 大 化 。 

2. 为 了 在 实验 室 中 对 设计 的 功能 进行 检查 ， 设 计 师 必须 马上 得 到 设计 样机 。 
此 时 ， 不 必 使 用 特定 种 子 或 种 子 扫描 进行 布局 ， 因 为 在 功能 检查 基本 合格 后 ， 设 
计 者 可 随时 使 用 种 子 扫描 做 布局 优化 ， 以 提高 时 序 裕 量 。 

3. 使 用 种 子 是 满足 时 序 需求 的 唯一 方法 。 设 计 不 再 推出 新 版 本 ， 这 是 设计 
的 最 终 版 本 。 例 如 ASIC 设计 的 FPGA 样机 应 使 用 种 子 扫描 做 布局 优化 ， 以 提高 
设计 的 速度 性 能 。 

奉 实现 时 序 收敛 的 目标 必须 依赖 于 某 个 特殊 的 种 子 ， 换 言 之， 依赖 于 FPCA 
厂商 所 提供 软件 的 某 个 特殊 版 本 ， 则 该 人 P 或 者 设计 模块 就 不 可 重用 。 
12.3.4.2 高 级 优化 (对 设计 有 更 高 要 求 时 才 选 用 ) 

正如 在 CAD 工具 设置 部 分 中 所 提 到 的 ，FPGA 设计 工具 提供 了 几 十 个 用 于 
设计 优化 的 选项 。 本 节 将 介绍 几 个 最 具 代 表 性 、 最 有 效 的 选项 。 

物理 综合 优化 

大 多 数 FPGA 厂商 提供 的 工具 包含 物理 综合 优化 选项 。 物 理 综合 紧密 结合 布 
局 布线 工具 ， 会 对 时 序 有 问题 的 逻辑 再 做 一 次 综合 。 和 常用 技术 包括 寄存 器 重新 定 
时 和 寄存 此 复制。 这 两 个 技术 也 可 通过 修改 RTL 代码 实现 ,但 是 需要 重新 编写 
大 量 的 代码 。 物 理 综合 还 可 以 进行 许多 种 别 的 优化 ， 但 是 这 两 个 优化 是 最 常用 的 
而 且 通 常 是 最 有 效 的 。 

在 某 些 设计 中 ， 物 理 综 合 能 把 设计 的 时 钟 频 率 提 高 20% 以 上 。 对 于 那些 精 
心 编码 合理 使 用 寄存 器 的 设计 ， 其 性 能 增益 可 能 只 能 达到 1% ~2% 。 然 而 ， 这 
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种 优化 是 要 付出 代价 的 。 换 言 之 , 设计 的 编译 时 间 会 急剧 增加 ， 通 常 是 2 倍 或 者 
更 多 。 它 也 会 限制 设计 师 使 用 形式 验证 工具 ， 因 为 这 些 工具 通常 与 寄存 器 重 定时 
有 冲突 。 
由 于 编译 时 间 的 有 影响， 设计 师 应 该 考虑 把 物理 综合 的 使 用 限制 在 问题 模块 的 
量 设计 流程 中 。 
使 用 物理 综合 是 全 自动 的 ， 即 设计 师 只 需要 设置 选项 并 编译 。 
设计 空间 的 拓展 
大 多 数 FPGA 厂商 在 它们 的 工具 包 中 提供 了 一 些 实用 程序 。 这 些 实用 程序 可 
以 使 用 不 同 的 设置 和 种 子 ， 自 动 运行 多 个 编译 ， 以 期 找到 能 为 设计 带 来 最 好 效果 
的 设置 。 
由 于 种 子 对 布局 布线 的 影响 ， 设 计 师 只 应 在 设计 的 最 后 阶段 ， 当 设计 实际 上 
已 经 完整 并 且 设 计 师 致力 于 时 序 收敛 时 ,使 用 设计 空间 拓展 。 
这 类 实用 程序 通常 能 够 执行 十 个 或 者 更 多 的 编译 ， 因 此 将 需要 花费 几 天 时 间 
才能 完成 编译 。 
幸运 的 是 主流 FPGA 厂商 已 将 多 处 理 技 术 应 用 于 这 些 实用 程序 ， 因 此 多 个 编 
译 能 并 行 地 而 不 是 顺序 地 执行 。 这 大 大 地 缩短 了 编译 时 间 。 
使 用 设计 空间 拓展 工具 的 缺点 是 ， 如 果 设 计 师 修改 了 设计 的 RTL 代码 ， 由 
于 种 子 的 随机 特性 ， 设 计 师 需 ;要 重新 运行 该 实用 程序 。 
设计 空间 拓展 也 能 在 设计 中 的 单个 模块 上 运行 。 这 项 技术 很 强大 ， 可 以 缩短 
编译 时 间 ， 并 只 对 设计 性 能 关键 的 区 域 进行 最 优化 。 
这 项 技术 在 增 量 编译 设计 流程 中 特别 有 效 。 在 该 流程 中 ， 设 计 空 间 拓展 只 
时 序 临 界 的 设计 模块 进行 优化 。 
如 果 设 计 师 对 一 个 设计 模块 或 者 完整 的 设计 使 用 设计 空间 拓展 ， 所 使 用 的 确 
切 设置 应 该 在 设计 中 进行 记录 ， 以 使 其 他 设计 师 能 重 现 结果 。 
12.3.4.3 编译 报告 和 分 析 工 具 
审查 综合 和 布局 布线 报告 的 警告 有 助 于 实现 时 序 收敛 的 目标 。 这 些 警 告 
提供 了 可 用 来 帮助 提高 设计 性 能 的 信息 。 应 该 规定 设计 师 在 设计 过 程 中 必 细 
例外 地 审查 并 消除 来 自 工程 的 所 有 警告 。 这 项 工作 是 必须 的 ， 因 为 这 些 警 告 
人 
警告 来 自 所 购买 的 卫 ， 则 设计 师 就 不 能 通过 修改 RTL 代码 来 消除 该 警告 ， 这 是 
警告 审查 面临 的 难题 之 一 。 若 发 生 这 种 情况 ， 则 设计 师 应 该 与 该 全 供应 次 取得 
联系 ， 若 他 们 能 证 实 该 警告 没有 问题 可 以 忽略 ， 设 计 师 就 可 以 在 工程 中 记录 该 信 
息 ， 并 且 在 以 后 的 编译 中 和 忽略 该 警告 。 
报告 文件 本 身 有 详细 的 关于 FPGA 器 件 资 源 使 用 情况 的 信息 ， 从 而 可 以 用 来 
确定 器 件 中 哪个 模块 使 用 的 资源 最 多 。 
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来 自 编译 报告 的 信息 有 助 于 确定 布局 布线 中 的 困难 ， 例 如 消耗 在 布局 布线 上 
的 时 间 。 布 线 时 间 很 长 可 能 是 由 于 布局 不 合理 造成 的 。 对 某 些 节 点 做 人 工 手 动 布 
局 或 在 布局 上 多 花 些 功夫 ， 布 线 时 间 有 可 能 缩短 。 

编译 报告 还 提供 已 执行 优化 的 详细 资料 ， 如 已 经 从 设计 中 移 除 的 寄存 部 。 这 
些 信息 能 帮助 设计 师 找到 RTL 代码 中 的 问题 ， 或 解释 为 什么 故障 逻辑 已 经 被 移 
除了 ， 使 得 设计 师 有 目的 地 修改 RTL 代码 。 

编译 报告 还 列 出 了 被 忽略 配置 的 有 关 人 信息， 设计 者 能 从 中 分 辨 出 哪些 信息 
创建 配置 时 由 打字 错误 而 引起 的 ， 哪 些 信息 是 因为 配置 已 过 时 而 引起 的 ， 这些 
题 都 应 从 工程 中 删除 。 

除了 编译 报告 文件 之 外 ，FPGA 厂商 还 提供 了 用 图 形 来 描述 设计 的 工具 。 

为 了 更 好 地 理解 RTL 代码 并 查看 综合 和 布局 布线 的 结果 ， 设 计 师 应 该 用 这 
些 图 形 工 具 来 仔细 检查 结 

这 些 浏 览 工具 提供 了 设计 层次 化 的 结构 框图 以 及 设计 技术 实现 的 视图 。 技 术 
实现 视图 详细 地 描述 了 在 综合 或 布局 布线 之 后 ， 设 计 是 如 何 映射 到 目标 技术 上 去 
的 。 

层次 化 的 结构 框图 视图 有 助 于 理解 设计 的 架构 ， 因 此 也 有 助 于 理解 如 图 12- 
11 中 所 示 的 设计 流 。 
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图 12-11 ” Quartus 工 软件 中 的 RTL 浏览 器 示例 


当 从 别处 继承 设计 模块 时 ， 应 该 使 用 这 些 浏览 工具 对 该 设计 有 一 个 可 视 化 的 
理解 。 由 于 浏览 工具 详细 地 描述 了 设计 中 的 数据 流 和 模块 间 的 交互 ， 有 助 于 对 天 
件 进 行 版 图 规划 。 浏 览 工具 还 提供 了 可 视 的 功能 框图 ， 如 图 12-12 所 示 的 有 限 状 
态 机 。 
具体 的 技术 视图 有 助 于 理解 设计 是 如 何在 FPGA 中 实现 的 ， 并 能 用 来 确定 可 
以 被 优化 的 区 域 。 它 能 快速 地 给 出 关键 路 径 上 的 逻辑 层次 数 ， 并 能 链接 到 相关 的 
RTL 代码 ， 有 助 于 将 RTL 源 代码 与 具体 电路 的 实现 关联 起 来 。 

技术 映射 视图 和 时 序 分 析 工 具 一 起 使 用 时 ， 有 助 于 为 设计 创建 合法 的 复杂 时 
序 约束 。 时 序 分 析 报 告 中 的 每 一 条 路 径 可 以 在 技术 映射 视图 中 定位 。 在 技术 映射 
视图 中 ,设计 师 可 以 仔细 检查 这 条 路 径 的 实现 ， 确 定 该 路 径 是 否 属于 时 序 异常 ， 
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例如 多 周期 路 或 伪 路 径 ， 然 后 在 时 序 约束 文件 中 做 出 合理 的 分 配 。 
12.3.4.4 版 图 规划 工具 

所 有 FPGA 厂商 提供 的 设计 工具 都 包含 一 个 版 图 规划 工具 ， 在 某 些 情况 下 还 
会 有 多 个 版 图 规划 工具 。 

在 FPGA 时 代 的 早期 ， 这 些 工 具 曾 在 理解 FPGA 设计 的 架构 和 优化 设计 性 能 
方面 起 过 决定 性 的 作用 。 

如 今 ， 前 一 种 说 法 即 有 助 于 理解 FPGA 设计 架构 的 这 种 说 法 依然 正确 。 版 图 
规划 工具 有 助 于 解释 FPGA 器 件 中 什么 资源 可 用 ， 并 可 用 于 分 析 设 计 的 布局 布线 
结果 。 但 是 ， 后 一 种 有 关 优化 设计 性 能 的 说 法 就 不 那么 正确 了 。 在 大 多 数 情况 
下 ， 没 必要 通过 设计 的 版 图 规划 来 达到 性 能 要 求 。 要 说 版 图 规划 能 为 性 能 带 来 好 
处 ， 可 能 也 就 是 针对 小 部 分 设计 的 版 图 规划 ， 而 不 是 针对 整个 设计 。 

如 今 版 图 规划 在 自 底 向 上 的 设计 流程 中 也 有 帮助 。 在 这 种 场合 中 ， 设 计 师 只 
要 将 设计 模块 分 配 到 器 件 的 各 个 区 域 即 可 ， 不 必 操 心 FPGA 的 单元 级 的 设计 。 只 
要 把 每 个 主要 的 设计 模块 分 配 到 带 件 的 某 个 区 域 即 可 。 

总 而 言 之 ，FPGA 厂商 的 版 图 规划 工具 有 四 个 主要 用 途 : 架构 探索 、 布 局 布 
线 分 析 、 创 建 布局 分 配 和 工程 设计 更 改 。 以 下 详 述 这 四 种 用 途 。 

架构 探索 

版 图 规划 提供 了 芯片 资源 的 可 视 化 显示 。 它 类 似 于 在 设计 师 的 桌面 有 一 个 详 
细 的 已 用 资源 和 未 用 资源 的 数据 一 览 表 。 版 图 规划 可 用 来 查看 FPCA 絮 件 架构 的 
细节 ， 如 在 一 个 逻辑 阵列 块 (LAB) 中 寄存 咒 的 数量 ， 在 一 行 中 LAB 的 数量 ， 
存储 器 的 布局 以 及 布线 信息 。 它 还 允许 设计 师 查 看 专用 模块 的 内 部 逻辑 ， 如 LUT 
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的 配置 和 寄存 器。 


D Q REGOUT 


data 


图 12-14 Quartus 开 世 片 规划 工具 中 Stratix V 自 适应 逻辑 模块 架构 的 细节 


版 图 规划 可 提供 用 图 形 表示 的 VO 单元 配置 (例如 延迟 链 、1O 标准 、 信 号 
方向 ) 和 IO 单元 内 部 寄存 右 使 用 等 情况 的 详细 资料 。 

查看 多 个 设计 模块 的 连接 是 版 图 规划 在 基于 团队 的 设计 中 的 实际 用 途 。 

版 图 规划 对 时 钟 网 络 的 规划 也 特别 有 用 。 版 图 规划 在 详细 描述 锁 相 环 
CPLL) 配置 的 同时 ， 也 详细 描述 了 芯片 中 哪些 区 域 能 由 PLL 的 输出 驱动 ， 哪 些 
区 域 能 由 器 件 的 全 局 时 钟 信号 驱动 。 这 种 功能 在 基于 团队 的 设计 环境 中 非常 好 
用 。 在 这 种 设计 环境 中 ， 设 计 师 需要 给 不 同 的 工程 师 和 功能 模块 分 配 资源 ， 以 防 
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止 资源 冲突 并 使 设计 师 能 针对 资源 的 共享 和 整合 进行 规划 ,例如 PLL。 

布局 布线 分 析 

版 图 规划 工具 为 检查 设计 的 实现 提供 了 一 个 很 好 的 解决 方法 。 它 显示 了 逻辑 
的 布局 信息 、 详 细 的 布线 信息 、 扇 人 和 扇 出 连接 ， 并 且 还 可 以 查看 关键 路 径 信 
自 


4 OD 


只 有 在 设计 存在 问题 时 才 需 要 进行 布局 布线 分 析 。 在 时 序 出 错时 ， 布 局 布线 
分 析 可 以 与 时 序 分 析 器 配合 使 用 ， 先 将 时 序 报告 中 的 失效 路 径 在 版 图 规划 视图 中 
进行 定位 。 然 后 才 可 能 去 分 析 设 计 的 布局 布线 ， 以 确定 能 否 通过 位 置 约束 来 修正 
时 序 ， 解 决 时 序 问题 ， 或 用 图 示 表 明 忌 片 中 某 个 区 域 已 十 分 拥塞 。 

用 版 图 规划 工具 可 以 清晰 地 观察 到 寄存 器 间 的 逻辑 层次 数量 和 IO 单元 中 是 
否 使 用 了 寄存 器 。 该 信息 也 能 用 其 他 工具 查看 ， 如 编译 报告 和 技术 映射 视图 。 

版 图 分 配 

版 图 分 配 工具 可 通过 布局 分 配 优化 设计 的 性 能 。 在 大 多 数 情况 下 ， 人 工 布 局 
不 如 自动 布局 布线 软件 。 然 而 ， 某 些 情况 下 ， 人 工 布 局 也 是 有 用 的 。 例 如 在 访问 
专用 硬件 模块 和 /或 引 脚 时 ， 由 于 资源 受 限 ， 节 点 间 流 水 线 寄存 器 的 放置 相距 其 
远 。 在 这 种 场合 下 ， 布 局 布线 软件 不 会 总 在 源 节 点 和 目的 节点 之 间 优 化 寄存 器 的 
布局 。 为 了 优化 布局 和 性 能 ， 设 计 师 可 以 在 版 图 规划 中 移动 寄存 器 。 

在 版 图 规划 中 区 域 分 配 主 要 被 用 于 创建 区 域 约束 ， 在 增 量 设计 或 基于 团队 设 
计 的 环境 中 常用 区 域 分 配 划 分 区 域 。 这 种 场合 中 ， 首 先 在 版 图 规划 中 创建 区 域 ， 
然后 将 设计 模块 分 配 到 该 区 域 中 。 换 言 之 , 使 用 区 域 分 配 能 防止 某 个 区 域内 的 资 
源 被 别人 占用 ， 为 尚未 完成 的 设计 模块 保留 可 用 资源 。 

在 创建 区 域 分 配 时 遇 到 的 难题 之 一 ， 是 如 何 处 理 内 部 存储 器 模块 和 DSP 模 
块 。 根 据 模块 的 资源 要 求 ， 为 使 设计 包含 足够 的 存储 模块 或 DSP 模块 设计 师 
可 能 需要 创建 一 个 非 矩形 区 域 。 

设计 师 还 必须 考虑 所 设计 的 模块 如 何 与 设计 的 其 余部 分 接口 ， 以 避免 无 意 中 
破坏 了 时 序 的 收敛 。 

工程 更 改 指 令 

版 图 规划 工具 提供 了 设计 快速 小 修改 的 手段 ， 因 而 能 缩短 系统 在 线 调 试 所 需 
时 间 。 

它 允 许 在 设计 中 编辑 、 创 建 和 删除 逻辑 及 连 线 。 建 议 设计 师 只 做 简单 的 更 
改 ,例如 改变 时 钟 的 极 性 、 时 钟 使 能 、 或 者 插入 简单 的 测试 逻辑 等 。 

这 种 方法 对 改变 0 单元 的 属性 特别 有 效 ， 例 如 改变 延迟 链 的 值 、 上 拉 电 阻 
的 使 用 、 转 换 速度 、1/O 标准 和 电流 强度 等 。 

它 还 可 应 用 于 修改 PLL 设置 或 者 将 一 个 信号 连 到 引 脚 进行 分 析 。 

不 推荐 设计 师 在 投入 生产 时 使 用 这 种 方法 来 改变 逻辑 ， 因 为 这 样 做 RTL 代 
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码 不 再 和 实现 的 功能 相 匹配 。 该 方法 只 能 用 做 简单 的 更 改 ， 还 要 能 证 明 更 改 后 能 
在 系统 中 能 正常 工作 。 进 行 工 程 更 改 后 需要 做 的 工作 有 : 对 RTL 代码 进行 修改 
以 匹配 功能 、 对 设计 进行 仿真 、 重 新 编译 并 产生 新 的 映像 文件 用 于 系统 在 线 测 
试 。 除 此 之 外 ， 还 应 当 对 新 版 本 设计 进行 完整 的 验证 。 


12.4 常见 的 时 序 收敛 问题 


本 节 列 出 了 设计 师 可 能 会 遇 到 的 一 些 常 见 的 时 序 收敛 问题 ， 以 及 如 何 解决 这 
些 问 题 而 应 当 采 取 的 措施 。 


12.4.1 缺失 时 序 约束 


FPCA 厂商 提供 的 布局 布线 软件 基于 所 给 出 的 时 序 约束 优化 设计 。 若 设计 师 
没有 对 某 关键 路 径 进 行 约束 ， 则 该 路 径 就 不 能 被 FPCA 软件 优化 ， 因 此 该 路 径 就 
可 能 不 满足 时 序 。 对 于 更 复杂 的 问题 ， 设 计 师 可 能 还 不 知道 该 设计 存在 时 序 问 
题 。 时 序 分 析 只 会 报告 不 满足 时 序 约束 的 时 序 ， 因 此 若 某 路 径 没 有 被 约束 ， 则 该 
路 径 就 不 会 被 分 析 。 

大 多 数 时 序 分 析 工 具有 一 条 命令 来 报告 没有 被 时 序 约束 的 路 径 。 建 议 设计 师 
执行 该 命令 来 查看 设计 中 是 否 有 未 被 约束 的 路 径 ， 然 后 对 这 些 路 径 设置 恰当 的 时 
序 约束 。 

设计 师 使 用 正确 的 时 序 约束 十 分 重要 。 要 分 析 时 序 报告 并 确认 所 有 的 多 周期 
路 径 或 伪 路 径 的 确 是 时 序 异 常 。 使 用 通配符 作为 时 序 异常 约束 配置 的 一 部 分 是 很 
容易 的 ， 但 这 样 做 会 在 不 经 意 间 将 该 约束 应 用 在 不 是 时 序 异 常 的 寄存 器 上 ， 从 而 
会 导致 在 线 测 试 过 程 时 发 现时 序 出 错 ， 而 该 错误 在 时 序 分 析 文 件 中 却 无 报告 。 


12. 4.2 ”时序 约束 发 生 冲 突 


设计 师 使 用 通配符 设置 时 序 约束 有 可 能 引起 路 径 的 时 序 约束 冲突 。 虽 然 鼓励 
使 用 通配符 ， 但 设计 师 必 须 确定 所 使 用 的 通配符 是 正确 的 。 大 某 路 径 上 存在 多 个 
互相 冲突 的 约束 ， 则 布局 布线 引擎 只 能 按照 其 中 一 个 约束 条 件 进 行 优化 。 该 约束 
条 件 通 常 是 最 后 输入 的 约束 。 这 将 导致 其 他 约束 不 起 作用 ， 从 而 造成 时 序 错误 。 
时 序 冲突 通常 发 生 在 有 多 时 钟 域 路 径 的 设计 中 。 


12.4.3 高 扇 出 寄存 器 


高 扇 出 寄存 器 的 目的 寄存 器 位 置 会 导致 源 寄 存 器 与 目的 寄存 器 之 间 的 长 线 延 
迟 。 布 局 布线 软件 通常 会 进行 布局 优化 ， 因 而 这 也 不 是 个 问题 。 然 而 当 位 置 约束 
限制 了 布局 的 选择 时 ， 这 就 是 个 问题 了 。 例 如 一 个 高 肩 出 寄存 器 是 很 多 寄存 器 的 
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输入 ， 这 些 寄存 器 又 连接 到 FPGA 融 件 不 同 面 的 引 脚 上 ， 由 于 这 些 寄存 器 到 引 脚 
的 i 要 求 非常 临界 。 为 了 满足 如 时 序 ， 不 得 不 把 目的 寄存 器 放置 在 IO 单元 内 
或 者 紧邻 VO 单元 。 而 将 源 寄存 器 放置 在 所 有 目的 寄存 器 附近 是 不 可 能 的 。 

以 下 是 解决 这 个 问题 的 最 好 方法 ， 采 用 其 中 一 个 即 可 : 

1. 创建 更 好 的 引 脚 分 配 ， 或 

2. 复制 源 寄存 絮 ， 使 它们 能 靠近 每 组 引 脚 放置 。 最 好 在 RTL 级 进行 这 个 操 
作 。 


12.4.4 只 差 一 点 就 能 满足 时 序 


若 设计 已 基本 完成 ， 但 还 差 一 点 才能 满足 理想 的 时 序 要求 ， 并 且 设 计 进 度 已 
不 允许 设计 师 再 返回 到 RTL 代码 进行 修改 ， 则 设计 师 应 该 尝试 FPGA 设计 工具 
中 每 一 个 可 用 的 选项 ， 努 力 达到 时 序 收敛 的 最 高 目标 。 大 多 数 厂商 提供 的 软件 有 
设计 空间 拓展 的 功能 。 这 种 功能 除了 使 用 种 子 扫描 布线 外 ， 会 循环 变化 各 种 优化 
设置 来 尽量 找到 满足 时 序 要 求 的 最 优 设 置 。 该 方法 特别 耗 时 ， 因 为 设计 师 可 能 
运行 10 多 次 编译 。 然 而 ， 它 可 能 带 来 超过 20% 的 性 能 改善 。 为 了 缩短 多 次 编译 
所 需要 的 时 间 ， 设 计 师 应 该 使 用 设计 空间 拓展 工具 中 的 高 级 功能 ， 在 多 台 机 器 上 
并 行 执行 多 设置 编译 。 
12.4.5 不 宜 过 早 设置 位 置 约束 


寿 在 设计 过 程 的 早期 就 设置 位 置 约束 ， 则 在 整个 设计 演变 过 程 中 通常 会 保留 
这 个 约束 的 设置 。 然 而 过 早 将 位 置 约 束 值 添加 到 设计 中 ， 有 可 能 阻碍 后 期 设计 版 
本 的 性 能 提升 。 

还 有 一 种 诱惑 就 是 过 度 地 约束 设计 。 虽 然 位 置 约 束 对 单个 模块 的 效果 不 错 ， 
但 在 设计 整合 后 就 会 限制 布局 布线 工具 能 进行 的 优化 ， 从 而 导致 性 能 变 差 。 

在 以 上 这 两 种 情况 中 ， 建 议 删 除 逻 辑 位置 约 束 ， 创 建 原 设 计 的 新 版 本 。 寿 设 
计 不 能 满足 时 序 要 求 ， 则 检查 哪个 模块 有 问题 ， 对 出 现时 序 问题 的 模块 ， 恢 复 其 
原来 的 位 置 约 束 。 看 看 时 序 是 否 因 删 除 该 约束 而 受到 影响 。 若 对 时 序 没 有 影响 则 
删除 该 约束 。 若 对 时 序 有 影响 ， 则 保持 该 约束 ， 然 后 针对 其 他 约束 进行 同样 的 工 
作 。 

理想 情况 下 ， 设 计 师 希 望 不 使 用 逻辑 位 置 约束 就 能 实现 时 序 收敛 目标 。 


12.4.6 宛 长 的 编译 时 间 


避免 见长 编译 时 间 的 第 一 种 技术 是 使 用 增 量 编译 设计 流程 。 奉 设计 师 使 用 增 
量 编译 方法 ， 则 不 会 遭遇 元 长 的 编译 时 间 。 
避免 见长 编译 时 间 的 第 二 种 拉 术 其 实 是 对 第 一 种 技术 的 补充 。 就 是 使 用 带 有 


120 ， FPGA 设计 : 基于 团队 的 最 佳 实 践 


多 处 理 器 或 多 核 处 理 咒 的 工作 站 。FPCA 厂商 所 提供 设计 软件 的 算法 是 多 线程 的 
并 且 能 充分 利用 多 核 或 处 理 器 来 缩短 编译 时 间 。 为 了 充分 利用 多 处 理 器 ， 设 计 师 
应 该 确保 该 工作 站 有 大 量 的 高 速 RAM。 面 向 最 新 FPCA 器 件 设计 的 编译 ， 可 能 
要 使 用 多 达 16G 的 RAM。 这 些 算法 不 断 地 访问 RAM， 因 而 高 速 RAM 有 助 于 缩 
短 编译 时 间 。 

如 果 设计 很 容易 满足 性 能 要 求 ， 设 计 师 可 以 考虑 使 用 FPCA 厂商 提供 这 两 个 
选项 之 一 来 快速 地 对 设计 进行 布局 布线 。 这 样 可 以 减少 一 半 的 编译 时 间 ， 但 可 能 
导致 设计 性 能 的 降低 。 


12.5 设计 规划 、 实 现 、 优 化 和 时 序 收敛 清单 


1. 遵循 同步 设计 原则 ; 

2. 遵循 推荐 的 编码 规范 ; 

3. 为 增 量 设计 进行 设计 划分 ; 

4. 保证 RTL 代码 可 充分 利用 带 件 中 的 专用 硬件 资源 。 

在 RTL 代码 中 实例 引用 厂商 提供 的 原 语 模 块 ， 就 可 以 利用 (不 能 经 由 RIL 
代码 综合 得 到 的 ) 由 该 模块 所 描述 硬件 的 特殊 功能 。 

5. 为 设计 创建 完整 的 时 序 分 配 ; 
.确保 所 有 的 多 处 理 器 功能 已 经 开启 ， 以 缩短 编译 时 间 ; 
. 对 设计 中 时 序 临 界 的 区 域 进 行 版 图 规划 ; 
. 对 工艺 的 所 有 边 角 条 件 进 行 时 序 分 析 ; 
.分析 所 有 错误 和 警告， 做 出 必要 的 改动 以 消除 警告 并 记录 所 有 的 异常 ; 
10. 记录 达到 时 序 收敛 目标 时 的 所 有 设置 。 
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13.1 系统 在 线 调 试 的 难点 


对 在 系统 中 运行 着 的 任何 芯片 进行 调试 都 十 分 困难 ， 调 试 者 经 常会 被 搞 得 精 
疲 力 尽 。 你 设计 的 电路 板 也 许 能 正常 工作 ， 也 许 突然 纹 丝 不 动 。 这 时 设计 师 的 脑 
海里 就 会 出 现 这 样 的 想法 :“ 我 的 设计 能 正常 工作 吗 ?”。 于 是 工程 师 们 开始 聚 在 
一 起 讨论 : 问题 究竟 出 自 系统 的 软件 还 是 系统 的 硬件 ? 由 于 系统 软件 的 开发 费用 
十 分 昂贵 ， 所 以 一 开始 几乎 总 是 怀疑 问题 来 自 硬 件 ， 除 非 能 证 明 人 硬件 确实 没有 问 
题 。 本 章 中 ， 我 们 将 关注 能 用 于 快速 故障 定位 的 技术 。 

就 系统 在 线 调试 而 言 ，FPGA 与 ASIC 相 比 具有 明显 的 优势 。 这 个 优势 就 是 
FPCA 的 可 编程 性 。 对 ASIC 设计 而 言 ， 为 了 验证 设计 能 在 电路 板 上 的 正确 运行 ， 
设计 者 不 得 不 先 设计 调试 逻辑 ; 为 了 避免 再 次 投 片 的 昂贵 费用 ，ASIC 设计 者 还 
需要 尽 可 能 保证 设计 功能 100% 地 正确 。 在 做 FPGA 设计 时 ， 预 完 设计 的 片 内 调 
试 逻辑 是 设计 师 必然 用 到 的 关键 功能 ; 然而 FPGA 固有 的 可 编程 性 ， 使 得 调试 逻 
辑 可 以 由 主机 控制 ， 或 随 着 系统 在 线 调 试 的 进展 ， 被 添加 到 设计 中 。 

仿真 的 目的 是 在 设计 载 人 芯片 之 前 ， 能 够 发 现 设计 或 模块 集成 中 的 一 些 错 
误 。 然 而 ， 对 FPCA 设计 进行 穷 举 性 的 仿真 非常 耗 时 而 且 计 算 量 十 分 巨大 。 大 能 
用 真实 的 条 件 对 设计 进行 测试 ， 则 可 以 发 现 仿真 难以 发 现 的 问题 。 这 样 的 例子 有 
异步 时 序 问 题 、 信 号 完整 性 的 特殊 问题 和 软 /人 硬件 集成 问题 。 

本 章 中 ， 我 们 将 推荐 一 套 调试 方法 ， 使 设计 者 能 按 自 己 的 意愿 观察 系统 的 在 
线 运 行情 况 ， 并 帮助 设计 者 发 现 系统 在 线 运行 时 存在 的 问题 ， 以 验证 设计 是 否 正 
确 。 本 章 讨 论 的 技术 源 于 目前 常用 的 工具 和 技术 。 


13.2 规划 


在 创建 设计 时 ， 大 多 数 工程 师 往往 没有 考虑 到 设计 或 实现 中 会 有 错误 。 缺 乏 
经 验 的 工程 师 只 有 在 电路 板 测 试 出 现 问题 时 ， 才 开始 考虑 系统 的 在 线 调 试 。 而 经 
历 丰 富 的 工程 师 由 于 已 多 次 承受 了 设计 调试 的 压力 ， 从 而 希望 减少 在 高 度 紧张 环 
境 下 调试 的 时 间 。 她 /他 不 想 耗费 无 数 个 夜晚 或 周末 在 实验 室 里 为 出 现 的 问题 找 
原因 。 因 此 ， 这 些 工程 师 会 事先 编写 调试 计划 。 这 也 是 每 个 设计 者 需要 做 的 ! 
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系统 在 线 调试 计划 应 该 作为 设计 说 明 书 的 一 部 分 认真 地 编写 。 设 计 中 的 每 个 
主要 模块 都 应 该 有 一 个 在 线 调试 计划 ， 即 如 何 验证 模 抉 的 在 线 运行 情况 ， 以 及 针 
对 该 模块 应 使 用 哪 种 调试 策略 。 设 计 说 明 书 还 应 包含 关于 判断 该 模块 是 否 已 按 预 
期 运行 所 依据 的 信息 类 别 。 换 言 之 ， 判 断 模块 功能 是 否 正确 还 应 依据 以 下 三 种 信 
自 . 


LDO 。 


1) 系统 级 别 的 统计 信息 ， 例 如 存储 器 的 接口 效率 ; 

2) 总 线 上 的 性 能 瓶颈 分 析 ; 

3) 高 速 收发 接口 的 比特 错误 率 信息 。 ( 译 者 注 ， 至 少 根据 这 三 种 信息 才能 
判断 模块 在 线 运行 是 否 已 经 达标 。) 

除 调试 模块 之 外 ， 在 所 有 的 设计 模块 都 实现 之 后 ， 对 顶层 设计 也 应 该 有 一 个 
调试 计划 。 这 些 信息 源 自 第 4 章 ， 其 主要 内 容 介绍 设计 的 密度 和 引 脚 。 

调试 计划 应 该 指明 为 系统 在 线 调试 预 留 了 多 少 只 引 脚 、 多 少 逻 辑 和 存储 器 ， 
还 应 详细 列 出 系统 在 线 调试 过 程 中 的 使 用 方法 和 工具 。 

为 调试 设计 预 留 15% 的 器 件 引 脚 是 一 个 好 方针 。 这 不 包括 用 于 加 载 FPCA 
器 件 所 使 用 的 JTAG 引 脚 和 部 分 调试 过 程 所 使 用 的 引 脚 。 推 荐 的 调试 资源 需求 将 
第 13. 3 节 (关于 调试 方法 这 一 节 ) 中 将 进一步 讨论 。 


13.3 调试 方法 


为 方便 系统 设计 的 在 线 调 试 ，FPGA 厂商 和 EDA 公司 提供 了 多 种 可 用 工具 。 
在 本 节 中 ， 我们 将 介绍 最 常用 的 工具 和 方法 ， 以 及 在 什么 时 候 使 用 它们 。 


13.3.1 利用 引 脚 调试 


这 是 针对 FPGA 设计 最 常用 的 调试 方法 。 它 之 所 以 很 受 工程 师 欢 迎 是 因为 可 
以 通过 编程 将 不 同 的 信号 很 方便 地 布线 至 FPGA 器 件 的 各 个 引 脚 ， 而 且 软 件 处 理 
引 脚 布线 的 编译 时 间 很 得。 这 样 ， 在 实验 室 中 进行 调试 时 ， 在 几 十 分 钟 之 内 就 能 
根据 新 编写 的 文件 将 不 同 的 信号 连接 到 调试 引 脚 。 这 种 方法 ， 除 了 会 增加 所 检测 
言 号 的 扇 出 之 外 ， 在 大 多 数 情况 下 不 会 影响 原 设 计 的 实现 。 

奉 你 的 设计 已 几乎 把 FPGA 的 资源 耗 尽 ， 而 此 刻 还 必须 对 布局 布线 做 改变 ， 
才能 够 把 某 几 个 信号 连接 到 引 脚 。 在 这 种 情况 下 再 进行 布局 布线 ， 很 可 能 产生 腊 
步 时 序 问题 ， 必 须 避 免 这 种 情况 的 发 生 。 由 于 此 刻 资 源 缺 乏 ， 布 局 布线 工具 无 法 
将 外 部 输入 的 异步 信号 同步 化 。[ 译 者 注 : 此 时 综合 器 将 不 对 异步 信号 做 同步 化 
处 理 。] 

正 因为 如 此 ， 想 通过 引 脚 进行 调试 ， 设 计 者 必须 预先 为 调试 留 好 选 定 的 引 脚 
或 引 脚 区 域 。 
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在 FPCA 设计 软件 中 有 几 种 方法 可 将 内 部 信号 布线 连接 至 引 脚 。 最 常用 的 方 
法 就 是 通过 Floorplan 工具 ， 在 里 面 选择 所 需 信号 作为 源 ， 选 择 相应 的 引 肢 作为 
目的 地 ， 布 局 布线 软件 会 使 用 增 量 布线 将 信号 连接 至 该 引 脚 。 这 种 方法 用 于 一 两 
个 信和 号 的 连接 时 确实 很 简单 。 然 而 ， 对 比较 大 的 信和 号 组 采用 该 方法 就 会 变 得 很 费 
劲 。 举 一 个 常见 的 例子 : 在 32 个 引 脚 上 调试 32 位 总 线 。 当 然 ， 有些 工具 有 高 级 
功能 ， 它 允许 设计 者 通过 信号 的 查找 功能 或 者 脚本 化 的 接口 来 选择 信号 源 和 目的 
引 脚 ， 然 后 自动 地 实现 信号 和 引 肢 的 连接 。 
对 引 脚 信号 的 布线 时 序 要 求 非常 重要 ， 特 别 是 将 总 线 信号 布线 连 出 至 相应 引 
脚 时 。 为 了 使 总 线 和 时 钟 同步 ， 建 议 将 信号 在 引 脚 的 寄存 部 上 锁 存 后 再 和 输出。 你 
不 希望 这 些 信号 成 为 设计 中 的 关键 路 径 ， 因 此 必须 对 这 些 路 径 添加 时 序 约束 。 对 
于 高 性 能 的 设计 ， 设 计 者 可 能 需要 在 信号 和 引 脚 之 间 插 入 几 级 流水 寄存 器 。 一 些 
FPCA 设计 软件 已 经 提供 了 这 个 自动 化 选项 。 
使 用 引 脚 调试 信号 的 步 又 如 下 : 
. 为 调试 预 留 一 些 引 脚 ; 
.在 这 些 引 脚 上 设置 恰当 的 10 标准 ; 
.确定 设计 者 希望 连接 到 菜 引 脚 的 信和 号; 
确定 某 信 号 是 否 需要 插 人 流水 寄存 器 ; 
. 进行 恰当 的 时 序 分 配 ; 
.将 某 个 信号 布线 连接 至 某 个 引 脚 ; 
. 分 析 该 信号 的 时 序 ; 
. 对 FPGA 器 件 进行 编程 ; 
. 用 外 部 逻辑 分 析 器 或 示波器 分 析 这 些 引 脚 上 的 数据 。 
如 果 设 计 者 想 要 在 某 个 引 脚 上 查看 不 同 的 信号 ， 可 以 删除 与 该 引 脚 连接 的 不 
需要 查看 的 信号 ， 然 后 从 步 又 3 开始 重复 。 


13.3.2 片 内 逻辑 分 析 仪 


片 内 人 逻辑 分 析 仪 (ILA) 这 个 调试 工具 已 帮助 许多 设计 者 发 现 了 许多 故障 ， 
为 他 们 排忧解难 。 起 初 很 多 设计 者 认为 ILA 只 是 设计 流程 中 的 一 个 可 选项 而 已 ， 
直到 有 一 天 ， 遇 到 一 个 在 仿真 中 发 现 不 了 的 设计 漏洞 ， 此 时 他 才 想 起 使 用 ILA。 
他 用 ILA 隔离 故障 ， 找 出 问题 ,修复 系 统 并 加 以 验证 。 在 见识 了 ILA 的 强大 功能 
后 ，ILA 就 成 为 工程 师 在 FPCA 设计 流程 中 的 得 力 助 手 。 

主要 的 FPGA 厂商 和 一 些 EDA 工具 商都 提供 ILA，ILA 是 利用 FPGA 吕 件 内 
部 空余 的 逻辑 和 存储 器 资源 实现 的 。 

究竟 什么 是 ILA 呢 ? 

其 实 ILA 是 一 种 用 FPGA 内 部 逻辑 单元 实现 的 片 内 调试 工具 ， 它 可 提供 与 普 


No 
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通 逻 辑 分 析 仪 类 似 的 触发 能 力 ， 并 观察 设计 内 部 多 路 数字 信号 。ILA 的 优势 在 于 
不 必 为 调试 多 保留 若干 个 引 脚 ， 只 要 通过 FPGA 上 专 为 JTAG 接口 保留 的 引 脚 就 
可 以 输出 需要 观察 的 多 路 信号 。 采 用 最 新 技术 制造 的 FPGA 口 件 ， 其 运行 时 钟 频 
率 可 高 达 250MHz， 即 使 在 这 样 高 的 时 钟 频率 下 ，ILA 也 能 捕获 到 内 部 信号 的 数 
据 。 然 而 ，ILA 的 性 能 会 随 所 选用 的 触发 条 件 的 复杂 度 而 有 所 改变 。 使 用 ILA 时 
不 必 改 写 设计 文件 ， 这 是 ILA 的 另 一 个 优点 ， 这 是 因为 FPCA 厂商 提供 的 软件 能 
自动 地 将 ILA 插入 到 已 实现 的 FPGA 设计 中 。 对 设计 的 实现 无 任何 影响 。 

ILA 所 捕获 的 信号 数据 被 保存 在 FPCA 片 内 存储 块 中 ， 设 计 者 可 以 随时 读 出 
并 分 析 这 些 数据 。 另 外 ,在 一 个 FPGA 芯片 中 还 可 以 实现 多 个 逻辑 分 析 仪 ， 这 样 
做 的 好 处 是 能 同时 从 设计 中 的 不 同时 钟 域 捕获 数据 。 

既然 ILA 如 此 之 好 ， 那 么 请 问 ， 为 什么 并 非 所 有 的 设计 师 都 使 用 ILA 呢 ? 

答案 十 分 简单 : 设计 计划 做 得 不 够 好 。 在 很 多 设计 中 没有 为 使 用 ILA 保留 足 
够 多 的 FPGA 资源 。 最 常见 的 失误 是 没有 保留 足够 多 的 存储 器 资源 以 保存 需要 分 
析 的 数据 。 

本 书 曾 多 次 提 到 ， 设 计 者 必须 提前 规划 调试 所 需 资源 。 

为 了 使 用 ILA， 设计 者 必须 确保 以 下 3 个 条 件 : 

1. 有 可 用 的 JTAG 连接 ; 

2. 保存 分 析 数 据 的 存储 模块 足够 大 ; 

3. 有 产生 触发 条 件 的 逻辑 。 

大 多 数 ILA 均 有 如 下 标准 功能 : 

1. 样本 深度 和 用 于 保存 采样 数据 的 RAM 类 型 均 可 由 调试 者 设置 ; 

2. 高 级 触发 条 件 ， 例 如 基于 状态 的 触发 。 高 级 触发 条 件 精确 地 定义 了 在 什 
么 情况 下 ，(ILA) 将 开始 采集 数据 ; 

3. 连续 数据 的 存储 。 当 触发 条 件 发 生 时 ， 采 集 到 的 数据 被 连续 地 写 人 存储 
器 。 为 了 防止 已 保存 的 数据 被 覆盖 ， 这 种 操作 模式 需要 大 量 的 内 部 存储 器 ; 

4. 变化 数据 的 存储 。 在 数据 采集 的 过 程 中 ， 当 采样 值 与 上 一 个 采样 周期 的 
采样 值 有 所 不 同时 ， 才 将 新 采样 值 写 入 采集 缓冲 区 。 若 采样 值 没有 发 生 任何 改 
变 ， 则 下 一 个 采样 周期 不 保存 该 采样 值 。 

5. 条 件 性 存储 。 只 有 当 把 数据 写 和 人 存储 器 的 条 件 成 立时 ， 才 存储 数据 。 

实现 ILA 所 必须 的 逻辑 元 件 和 存储 器 的 数量 取决 于 触发 条 件 的 复杂 度 和 需要 
保存 的 数据 量 。 

减少 所 需 逻 辑 元 件数 量 的 有 效 方 法 是 将 采集 缓冲 区 的 段 数 减少 到 只 要 能 满足 
调试 需求 即 可 。 

另 一 种 技术 是 使 用 缓冲 采集 控制 来 精确 地 控制 写 人 采集 缓冲 区 的 数据 。 若 采 
用 这 种 技术 可 以 丢弃 与 该 设计 调试 无 关 的 采样 数据 。 变 值 存储 和 条 件 性 存储 可 用 
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于 减少 必须 的 内 部 存储 器 的 数量 。 
13.3.2.1 使 用 ILA 的 设计 流程 

1. 在 设计 中 添加 ILA。 该 功能 由 FPGA 厂商 提供 的 软件 自动 插入 ， 不 用 修改 
设计 代码 ， 也 不 用 修改 FPGA 屁 件 中 已 实现 的 设计 ; 

2. 配置 逻辑 分 析 仪 。 定 义 希望 观察 到 的 信号 ,设置 记录 信号 值 的 条 件 ; 
. 定义 触发 条 件 ; 
. 编译 设计 ; 
.对口 件 进行 编程 ; 
. 在 主机 上 运行 ILA 应 用 程序 ; 
. 查看 并 分 析 所 捕获 的 数据 。 
13.3.2.2 ILA 的 局 限 

由 于 FPGA 结构 的 限制 ， 并 非 设计 中 所 有 的 信号 都 能 被 [LA 观察 到 或 者 引 
出 ， 例 如 进位 链 中 的 部 分 信号 ， 就 无 法 用 ILA 观察 ; JTAG 信号 也 无 法 观察 。 

除非 设计 者 愿意 重新 编译 整个 设计 ， 否 则 设计 者 只 能 查看 到 布局 布线 之 后 的 
可 见 信 号 。 因 为 RTL 级 综合 过 程 中 进行 的 优化 往往 会 改变 信和 号 的 名 称 ， 这 使 得 
设计 中 的 组 合 信号 难以 识别 。 要 使 这 些 信 号 可 见 ， 设 计 者 可 以 在 RTL 代码 中 使 
用 综合 属性 来 保留 这 些 信号 。 但 这 样 的 设置 会 改变 设计 的 实现 。 因 此 ， 建 议 设计 
者 集中 精力 对 寄存 器 进行 系统 在 线 调试 ， 因 为 大 部 分 寄存 器 在 布局 布线 后 是 可 见 
的 ， 并 且 不 需要 重新 编译 整个 设计 。 
13.3.2.3 小 建议 

远程 调试 

如 果 在 最 终 设计 中 保留 ILA， 并 且 有 JTAG 连接 到 FPCA ， 我 们 就 能 对 设计 进 
行 远 程 调试 。 对 异地 的 设计 进行 调试 ， 远 程 调试 被 证 明 是 非常 有 价值 的 ， 甚 至 设 
计 者 在 办 公 室 或 家 中 也 能 调试 实验 室 中 设计 ; 但 前 提 条 件 是 设计 者 和 电路 板 相 连 
的 工作 站 之 间 能 通过 网 络 通信 。 

与 MATLAB 的 接口 

一 些 更 先进 的 ILA 提供 了 与 Mathworks MATLAB 软件 的 接口 。 这 个 选项 对 数 
据 进 行 数字 信号 处 理 ( DSP) 分 析 很 有 用 。 一 旦 数据 被 导入 MATLAB 环境 中 ， 
数据 就 能 以 适合 用 户 应 用 测试 的 格式 展现 出 来 。 

器 件 资源 不 足 

如 果 设 计 中 未 留 有 可 构造 ILA 的 足够 资源 ， 那 么 在 线 调 试 就 有 困难 ， 所 以 必 
须 从 最 终 的 设计 中 删除 一 部 分 功能 再 继续 调试 ， 这 也 是 调试 工作 的 一 部 分 。 这 样 
做 可 以 使 设计 者 在 线 调试 独立 的 模块 ， 并 验证 这 几 个 关键 模块 的 功能 是 否 正确 。 
虽然 这 样 做 不 能 解决 整个 系统 在 集成 中 出 现 的 问题 ,但 使 设计 者 能 检验 这 几 个 关 
键 模块 在 集成 中 出 现 的 问题 。 
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13.3.3 调试 逻辑 的 使 用 


在 设计 中 插入 调试 逻辑 是 实际 工作 中 常用 且 推 荐 的 设计 方法 。 第 13.4.3 市 
将 讨论 这 个 问题 ， 并 给 出 系统 性 能 报告 。 

正如 以 前 所 提 到 的 ,设计 者 应 该 针对 主要 设计 模块 的 接口 构建 测试 逻辑 、 监 
测 器 和 验证 器 。 在 证 实 设计 的 功能 完善 之 后 ， 可 以 删除 调试 逻辑 ;也 可 以 在 设计 
中 保留 调试 逻辑 ， 以 便 在 现场 出 现 故障 时 ， 可 提供 远程 调试 能 力 。 若 调试 逻辑 被 
保留 在 所 设计 的 产品 中 ， 则 建议 调试 逻辑 可 以 由 引 脚 、JTAG 或 软 处 理 器 关闭 或 
控制 ， 这 将 减少 最 终 设 计 的 功 耗 。 

调试 逻辑 也 可 以 和 本 章 描 述 的 其 他 调试 方法 一 起 使 用 。 添 加 一 个 简单 的 与 调 
试 引 脚 接口 的 多 路 器 ， 便 可 以 使 用 户 很 容易 地 将 他 们 希望 查看 的 信号 连接 到 引 脚 
上 ， 用 户 或 软 处 理 器 可 以 自由 地 切换 与 调试 引 脚 连接 的 信号 ， 观 察 其 波形 。 当 设 
计 者 需要 查看 不 同 信号 的 时 ， 就 能 快速 地 将 信号 切换 到 调试 引 脚 ， 而 不 必 每 次 都 
产生 新 的 FPGA 编程 文件 。 这 种 方法 可 以 节约 好 多 调试 时 间 。 

调试 逻辑 也 可 以 用 于 强制 FPGA 进入 某 种 特定 的 状态 ， 以 再 现 故 障 条 件 或 者 
测试 在 这 些 隔离 边 角 条 件 下 的 运行 情况 。 

主流 FPGA 厂商 提供 了 实用 的 调试 工具 ， 利 用 这 些 工 具 可 以 强制 逻辑 进入 某 
个 特定 的 状态 。 使 用 这 种 实用 调试 工具 能 显著 减少 开发 工作 量 。 

再 次 强调 一 下 ， 这 些 工具 可 以 与 其 他 调试 方法 相互 组 合 ， 形 成 高 级 调试 方 
案 。 比 如 ,与 JTAG 相 结合 时 ， 能 使 设计 者 动态 地 控制 实时 运行 的 控制 信号 。 同 
样 ， 它 也 能 与 ILA 相 结合 ， 强 制 产生 触发 条 件 。 通 过 这 些 方法 ， 就 可 以 使 用 简单 
的 测试 向 量 来 运行 设计 ， 并 显示 其 内 部 信号 的 波形 ， 而 不 需要 使 用 外 部 测试 设 
备 。 


13.3.4 外 部 逻辑 分 析 仪 


主流 FPCA 厂商 提供 与 安捷伦 ( Agilent) 和 泰克 (Tektronix) 公司 的 逻辑 分 
析 仪 的 接口 。 为 了 在 逻辑 分 析 仪 中 使 用 这 些 可 选 的 接口 ， 用 户 需 要 有 一 个 JTAG 
连接 器 和 供 逻 辑 分 析 仪 使 用 的 测试 插口 。 

在 FPGA 设计 全 速 运行 的 同时 ， 该 接口 能 够 使 用 最 少量 的 FPGA 输入 /输出 
(LO) 引 脚 ， 利 用 外 部 逻辑 分 析 仪 查看 芯片 内 部 信号 。 

与 13. 3. 3 节 描 述 的 调试 逻辑 方法 类 似 ， 这 种 方法 使 用 多 路 器 将 大 量 的 FPCA 
器 件 内 部 信和 号 连接 到 少量 的 输出 引 脚 上 。 

多 路 器 由 JTAG 通过 逻辑 分 析 仪 的 用 户 接口 进行 控制 。 并 且 为 了 简化 调试 ， 
逻辑 分 析 仪 还 能 在 屏幕 上 显示 信号 的 名 称 。 

与 ILA 相 比 ， 该 调试 方法 有 如 下 两 个 关键 优势 : 
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1. 更 广泛 的 样本 深度 ; 

2. 更 强 的 数据 处 理 能 力 。 外 部 逻辑 分 析 仪 拥有 比 FPGA 带 件 内 部 数量 多 得 
多 的 存储 器 。 

所 以 ， 当 设计 者 需要 存储 和 分 析 大 量 调试 数据 ， 并 且 已 在 电路 板 上 为 测试 插 
口 预 留 了 空间 时 ， 推 荐 使 用 这 种 调试 方法 。 


13.3.5 编辑 存储 器 内 容 


在 设计 中 ， 我 们 可 以 用 内 部 存储 模块 的 内 容 来 强制 系统 进入 测试 和 调试 状 
态 。 该 方法 在 测试 数字 信和 号 处 理应 用 时 特别 有 效 ， 例 如 滤波 器 中 存储 模块 里 面 存 
储 的 滤波 器 系数 。 进 行 这 个 操作 有 如 下 三 个 主要 方法 : 

1. 第 一 种 方法 : 加 载 一 个 新 的 编程 映像 ， 更 新 存储 器 的 初始 化 文件 。 设 计 
者 不 需要 重新 编译 设计 ， 只 要 改变 存储 器 的 初始 化 文件 ， 然 后 运行 汇编 生成 新 的 
编程 映像 即 可 。 该 方法 虽然 可 行 ， 但 是 改变 存储 器 的 内 容 需 要 给 FPGA 系统 重新 
上 电 。 

2. 第 二 种 方法 : 通过 生成 逻辑 使 设计 者 能 对 内 部 存储 器 进行 写 操作 ， 以 来 
改变 它 的 内 容 。 这 种 方法 我 们 在 13. 3. 3 节 使 用 逻辑 设计 进行 调试 部 分 曾经 描述 
过 。 由 于 能 在 设计 运行 的 同时 ， 控 制 存 储 器 模块 的 写 操作 ， 这 种 方法 比 之 前 的 方 
法 要 更 灵活 一 些 。 可 能 控制 逻辑 的 设计 会 十 分 复杂 ,但 是 其 回报 却 是 无 法 估计 
的 。 

3. 第 三 种 方法 : 使 用 FPGA 厂商 提供 的 解决 方案 之 一 ， 就 是 利用 JTAG 接口 
来 控制 内 部 存储 器 模块 的 读 写 操作 。 这 个 方法 需要 遵循 一 定 的 设计 原则 : 被 修改 
内 容 的 存储 器 ， 必 须 使 用 FPGA 厂商 提供 的 存储 器 原 语 来 进行 设计 。 这 种 方法 能 
够 最 简单 、 最 灵活 地 在 系统 中 更 新 存储 模块 内 容 ， 但 它 仍 有 些 局 限 性 。 其 中 最 大 
的 局 限 就 是 不 能 在 双 端 口 KAM 上 使 用 。 

这 些 调试 方法 不 仅 对 DSP 应 用 ， 对 于 其 他 应 用 效果 也 非常 好 。 

它们 不 仅 可 以 用 来 测试 和 纠正 存储 器 的 奇偶 校 验 位 ， 还 可 以 人 为 制造 奇偶 校 
验 错误 值 ， 以 检查 设计 对 错误 的 处 理 能 力 。 除 此 之 外 ， 如 果 在 实验 室 中 发 现 由 于 
奇偶 校 验 位 错误 导致 系统 故障 ， 设 计 者 能 使 用 这 种 方法 来 纠正 错误 并 且 继 续 核 
查 。 

该 方法 可 以 与 本 章 描 述 的 其 他 调试 方法 相 结合 ， 为 自己 装备 一 个 非常 强大 的 
调试 工具 武器 库 。 


13.3.6 利用 软 核 处 理 器 进行 调试 


许多 设计 师 忽 略 了 这 样 一 个 现实 的 方法 ， 就 是 可 以 在 设计 中 添加 软 核 处 理 融 
来 进行 设计 调试 。 添 加 一 个 软 处 理 器 只 要 用 1000-2000 个 逻辑 元 件 ， 加 上 部 分 内 
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部 存储 资源 。 

当 软 核 处 理 器 与 传统 的 调试 逻辑 相 结合 时 ， 将 会 变 成 强 有 力 的 调试 武器 。 处 
理 吉 能 控制 调试 逻辑 的 操作 ， 其 本 身 也 可 用 作 调 试 逻辑 。 描 述 复 杂 的 调试 触发 条 
件 将 变 得 比较 容易 ， 例 如 用 C 语言 来 描述 状态 机 的 触发 条 件 就 比 HDL 容易 得 多 。 

软 核 处 理 器 也 可 用 于 控制 存储 絮 的 读 写 操作 ， 它 不 但 拥有 片 内 人 逻辑 分 析 仪 
(ILA) 解决 方案 的 所 有 优势 ， 它 还 能 将 数据 存储 在 例如 DDR 亚 这 样 的 外 部 存储 
器 中 ， 这 样 就 能 存储 大 量 的 数据 以 供 分 析 。 

如 果 设 计 者 喜欢 用 C 语言 来 编程 ， 那 么 就 应 该 洽 试 一 下 使 用 软 核 处 理 器 来 
调试 设计 。 


13.4 使 用 案例 


13.4.1 上 电 调 试 


当 电 路 板 第 一 次 上 电工 作 时 ,设计 者 首先 要 确认 一 下 设计 是 否 按 照 正确 的 顺 
序 执行 ， 以 确信 该 FPGA 设计 能 与 系统 其 余部 分 正常 通信 。 若 上 电 后 系统 出 现 不 
能 运行 的 情况 ， 则 立刻 使 用 ILA 捕捉 FPCA 在 上 电 或 复位 后 的 FPCA 器 件 初始 化 
过 程 中 的 若干 个 触发 事件 。LLA 能 在 FPCA 咒 件 编程 后 即刻 捕获 数据 。 一 些 FP- 
GA 厂商 已 经 提供 了 具有 上 电 调 试 功能 的 ILA 解决 方案 。 


13.4.2 收发 接口 调试 


在 电路 板 上 电 之 后 ,设计 者 总 希望 确定 FPGA 器 件 上 的 收发 器 是 否 能 正常 工 
作 ， 例 如 是 否 能 发 送 /接收 来 自 系统 的 数据 。 

在 实际 应 用 中 ， 收 发 器 使 用 的 设置 与 实际 的 电路 板 不 完全 匹配 的 情况 比较 常 
见 。 在 这 种 情况 下 ， 如 果 收 发 器 能 重新 动态 配置 ， 就 可 以 在 FPCA 器件 运行 时 对 
它 的 设置 重新 编程 ， 那 么 调试 就 相当 容易 。 幸 和 运 的 是 ， 主 流 FPGA 厂商 提供 了 这 
个 解决 方案 ， 让 用 户 能 够 完全 访问 收发 器 中 的 设置 ， 并 报告 数据 的 误 码 率 。 

若 在 收发 器 接口 中 已 构建 了 设计 调试 模块 ， 设 计 者 就 可 用 现成 的 设计 来 测试 
收发 器 的 误 码 率 ， 也 可 以 直接 把 厂商 提供 的 某 个 调试 设计 下 载 到 FPGA 中 来 测试 
收发 器 的 误 码 率 。 后 一 种 方法 最 为 常用 。 

这 些 调 试 设计 由 数据 模式 发 生 器 、 校 验 模 块 和 收发 器 三 部 分 组 成 ， 其 中 收发 
器 可 以 动态 重 配 以 改变 PMA 的 配置 。 在 发 射 端 ， 可 以 针对 不 同 通道 介质 设置 预 
加 重 值 ， 它 影响 输出 端 差 分 电压 (Differential Voltage，VOD) 和 接收 端的 眼 图 ; 
在 接收 端 能 改变 均衡 和 直流 增益 的 设置 。 

通过 循环 设置 、 生 成 和 校 验 数 据 ， 能 在 每 个 设置 上 得 到 误 码 率 测试 结果 。 这 
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样 做 的 目的 主要 有 两 个 : 

1. 分 析 收 发 髓 的 信号 质量 ; 

2. 调整 收发 右 设 置 ， 以 匹配 承载 的 电路 板 并 抑制 收发 絮 接 口 与 电路 板 之 间 
可 能 存在 的 信号 完整 性 问题 ; 

一 旦 找到 了 最 优 的 设置 ， 就 可 以 将 其 应 用 于 实际 的 收发 器 设计 中 。 


13.4.3 系统 性 能 报告 


一 般 会 收集 设计 中 系统 级 别 的 统计 信息 来 确定 设计 是 否 达 到 期 望 的 系统 性 
能 。 这 些 信 息 包括 系统 的 吞吐 量 和 带宽 使 用 情况 。 通 过 这 些 信息 ， 就 可 以 找到 设 
计 中 的 瓶颈 ， 并 改善 设计 来 满足 对 吞吐 量 和 带宽 的 要 求 。 使 用 监测 器 来 完成 收集 
和 分 析 的 工作 。 

在 早期 测试 或 者 分 离 边 角 情 况 下 ， 设 计 者 可 能 需要 去 产生 数据 流 来 运行 不 同 
的 传输 情况 。 通 常 系统 软件 会 负责 这 个 工作 ， 然 而 在 电路 板 调试 的 初期 ， 软 件 还 
存在 问题 或 者 它 根 本 还 没有 准备 好 ， 硬 件 工程 师 就 需要 有 一 种 手段 来 产生 测试 设 
计 模 块 的 数据 流 。 

对 于 使 用 特定 协议 的 应 用 ,设计 者 可 能 希望 检查 并 报告 与 协议 冲突 的 地 方 ， 
这 需要 测量 并 分 析 传 输 情况 和 信号 。 

这 类 数据 的 捕获 、 激 励 和 报告 ， 最 好 通过 在 设计 中 构建 验证 IP 来 解决 ， 例 
如 ， 能 将 处 理 器 子 系统 模块 挂 起 的 监测 器 和 接口 IP 上 的 协议 检查 器 。 

如 前 所 述 ， 通 过 计划 系统 在 线 验证 ， 设 计 者 在 一 拿 到 硬件 时 就 能 让 设计 正确 
地 运行 起 来 。 如 果 像 第 九 章 推荐 的 那样 ， 在 设计 模块 中 使 用 标准 接口 ， 就 能 快速 
构建 一 个 验证 IP 库 ， 该 库 还 可 以 在 以 后 的 设计 中 重用 ， 可 以 方便 地 插入 所 设计 
的 系统 中 。 设 计 者 可 使 用 系统 集成 工具 ， 比 如 Altera 的 SOPC， 将 验证 模块 拖 中 
到 系统 中 ， 将 设计 的 工作 量 最 小 化 ， 而 且 对 系统 性 能 的 影响 也 很 小 。 同 时 将 验证 
IP 保留 在 最 终 设计 中 ， 对 现场 出 现 故 障 的 任何 系统 的 维修 都 十 分 有 用 。 设 计 者 
使 用 的 验证 全 也 可 以 和 FPGA 器 件 上 进行 JTAG 控制 的 基础 设施 一 起 使 用 ， 这 样 
设计 者 就 能 通过 JTAG 接口 访问 /控制 数据 。 


13.4.4 软 核 处 理 器 调试 


软 核 处 理 器 设计 的 调试 ， 同 时 涉及 硬件 和 应 用 软件 的 调试 ， 使 得 调试 过 程 十 
分 复杂 ， 这 就 要 求 工程 师 要 熟知 相关 学 科 的 知识 。 硬 件 调试 可 以 通过 使 用 本 章 先 
前 介绍 过 的 方法 进行 ， 之 后 还 需要 和 运行 在 软 核 处 理 器 上 的 代码 一 起 执行 。 部 分 
调试 工作 可 使 用 强制 硬件 进入 已 知 状 态 的 方法 ， 有 效 地 模拟 软件 的 运行 。 

软件 调试 很 大 程度 上 依赖 于 正在 使 用 的 软件 工具 链 。 建 议 设计 者 阅读 软 核 处 
理 絮 的 文献 ， 以 熟悉 可 用 的 调试 功能 。 
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本 章 的 其 余部 分 ， 将 关注 在 大 多 数 软件 调试 工具 链 中 存在 的 标准 功能 集 ， 以 
及 它们 是 如 何 用 来 进行 设计 的 实时 分 析 的 。 
13.4.4.1 软件 分 析 

大 多 数 处 理 器 的 工具 链 提供 软件 分 析 器 。 软 件 分 析 器 可 提供 有 关 不 同 功能 在 
应 用 中 运行 时 间 长 短 的 报告 。 软 件 分 析 融 能 确定 所 设计 的 代码 中 可 能 会 导致 设计 
性 能 问题 的 非 优化 区 域 。 设 计 者 应 该 通过 分 析 软 件 来 决定 需要 优化 的 软件 代码 或 
可 以 通过 便 件 加 速 的 代码 。 
13. 4. 4.2 观察 点 

在 代码 中 插入 观察 点 能 捕获 一 个 全 局 变量 的 所 有 变化 。 这 种 方法 可 以 发 现 已 
被 破坏 的 《“C” 代 码 中 的 ) 全 局 变量 ， 因 此 十 分 有 用 。 
13. 4. 4.3 ”堆栈 溢出 

这 种 方法 适用 于 当 有 实时 操作 系统 在 处 理 器 上 运行 的 情况 。 在 这 种 场景 下 ， 
每 个 正在 运行 的 任务 有 它 自 己 的 堆栈 。 这 增加 了 堆栈 溢出 状态 发 生 的 可 能 性 。 在 
基于 FPCA 的 舱 入 式 系统 中 这 类 问题 更 加 常见 ， 因 为 它 非常 可 能 对 堆栈 可 用 的 存 
储 骨 数量 进行 限制 。 大 多 数 处 理 器 的 集成 开发 环境 (IDE) 含有 一 个 可 选 设置 
项 ， 用 于 启动 实时 的 堆栈 检查 。 
13.4.4.4 断 点 

一 些 软 核 处 理 器 的 工具 链 提供 了 一 个 调试 选项 ， 对 放置 在 只 读 存 储 咒 中 的 代 
码 设置 硬件 断 点 ， 如 闪存 。 这 需要 修改 代码 的 编译 设置 ， 虽 然 会 导致 可 优化 的 代 
码 减少 ， 但 代码 调试 起 来 却 容易 得 多 。 
13.4.4.5 单 步 执行 代码 

将 软件 编译 器 的 优化 级 别 设置 为 无 ， 虽 然 软件 代码 会 运行 得 慢 一 些 ， 但 由 于 
源 代码 和 执行 代码 完全 匹配 ， 调 试 工作 就 会 容易 得 多 。 这 种 方法 和 软件 断 点 配合 
时 效果 很 好 :执行 代码 会 一 直 运 行 到 断 点 处 ， 然 后 就 停止 在 那儿 。 这 种 方式 可 以 
支持 单 步 执行 代码 ， 检 查 设计 中 的 变量 值 ， 验 证 执行 代码 功能 的 准确 性 。 


13.4.5 器 件 的 编程 问题 


第 三 方 公司 和 FPCA 厂商 提供 了 大 量 的 JTAG 调试 工具 ， 帮 助 设计 者 通过 
JTAG 调试 FPGA 器 件 的 编程 问题 。 最 常见 的 难题 是 企图 调试 来 自 不 同 厂商 的 FP- 
GA 器 件 的 JTAG 链 上 出 现 的 问题 。 

来 自 FPGA 厂商 的 调试 工具 可 以 专门 测试 JTAG 链 的 信号 完整 性 以 及 检测 
JTAG 链 的 间 欣 性 故障 。 这 些 工 具 检 查 FPGA 器 件 连接 是 否 正确 ， 并 能 运行 JTAG 
的 调试 命令 。 

这 些 工具 在 检测 以 下 故障 时 非常 有 效 : 

1. 开路 ; 
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2. 与 Vcc 短路 ; 

3. 与 GND 短路 。 

建议 设计 者 在 接收 到 电路 板 后 ， 立 刻 使 用 JTAG 链 上 的 JTAG 调试 工具 对 电 
路 板 进 行 上 述 3 项 检查 。 


13.5 系统 在 线 调试 核对 清单 


1. 调试 规划 

(a) 为 调试 预 留 引 脚 ; 

(b) 为 使 用 片 内 逻辑 分 析 仪 ILA) 预 留 逻 辑 资源 和 存储 器 资源 ; 

(c) 确保 所 使 用 的 JTAG 能 够 访问 到 FPGA 器 件 ; 

(d) 在 电路 板 上 放置 一 个 测试 插口 ， 用 来 与 逻辑 分 析 仪 或 者 示波器 连接 ; 

(e) 向 设计 中 添加 调试 逻辑 ， 或 者 使 用 FPCA 厂商 提供 的 调试 工具 将 数据 存 
和 存储器， 或 者 将 数据 经 多 路 器 连接 到 引 脚 ; 

(f) 考虑 在 设计 中 添加 软 核 处 理 器 用 于 调试 ; 

2. 进行 调试 

(a) 使 用 增 量 编译 锁定 原 有 设计 的 实现 ; 

(b) 将 实时 运行 的 数据 信号 或 少量 控制 信号 通过 增 量 布线 连接 至 引 脚 ， 方 
便 在 逻辑 分 析 仪 或 示波器 上 进行 分 析 ; 

(c) 为 了 捕获 基于 事件 触发 的 数据 ， 可 以 在 设计 中 添加 一 个 片 内 逻辑 分 析 
仪 (ILA)。 如 有 可 能 的 话 ， 使 用 布局 布线 后 的 信号 名 ， 以 避免 对 该 整个 设计 进 
行 重新 编译 。 

3. 和 若 在 JTAG 链 中 有 多 个 FPGA 器 件 ， 则 选择 需要 调试 的 器 件 。 

4. 一 旦 找到 了 错误 ， 马 上 修改 RIL 代码 ， 并 且 通 过 仿真 验证 修改 是 否 正确 。 
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14.1 设计 签收 过 程 


设计 流程 中 需要 安排 一 个 步骤 来 决定 设计 投 片 的 时 间 节 点 。 在 设计 已 通过 完 
整 的 硬件 测试 ， 并 且 所 有 的 设计 和 测试 过 程 都 已 达标 之 后 ， 再 做 这 个 决定 。 

应 该 召集 项 目的 所 有 股东 召开 一 个 管理 会 议 ， 来 决定 是 否 投 片 。 会 议 上 将 审 
核 设计 的 质量 资料 ， 由 此 决定 设计 是 否 应 投入 生产 。 

设计 中 所 有 已 发 现 的 错误 应 该 得 到 纠正 ， 但 对 产品 发 布 而 言 非 关 键 性 的 错误 
也 可 以 被 接纳 。 被 接纳 的 错误 应 该 用 文档 加 以 说 明 ， 以 便 到 下 一 个 版 本 的 设计 中 
再 进行 修改 。 

设计 签收 需要 所 有 当事人 和 部 门 的 批准 。 

设计 签收 过 程 要 用 到 以 下 六 个 指标 ， 这 些 指标 可 通过 第 五 章 所 描述 的 工具 得 
到 。 

1. RTL 必须 满足 编码 指导 原则 ; 

2. 设计 必须 满足 功能 覆盖 和 代码 获 盖 的 目标 ; 

3. FPGA 项 目 必 须 没 有 警告 ， 若 还 有 警告 ， 则 必须 详细 说 明 ; 

4. 必须 满足 设计 说 明 书 中 的 时 序 要 求 ; 

5. 必须 满足 系统 在 线 调试 的 要 求 。 在 某 些 产品 中 ,这 可 能 包含 老化 测试 和 
全 环境 测试 ; 

6. 不 满足 设计 说 明 书 的 每 个 情况 都 必须 详细 说 明 。 


14.2 设计 签收 之 后 


在 设计 已 经 获准 生产 之 后 ， 需 要 把 发 布 的 版 本 和 所 有 相关 的 设计 和 测试 资料 
存档 。 这 将 作为 设计 所 有 未 来 版 本 的 基础 。 

项 目 经 理 要 主持 项 目 完成 后 的 总 结 会 ， 讨 论 什么 做 对 了 、 什 么 做 错 了 以 及 从 
项 目 中 学 到 了 什么 。 这 些 信息 将 被 用 于 未 来 项 目的 规划 。 

在 设计 发 布 会 成 功 召 开 之 后 ， 可 开始 着 手下 一 个 项 目的 工作 ， 它 很 可 能 就 是 
该 设计 的 下 一 个 版 本 ! 
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